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OLIGONUCLEOTIDE ANTISENS 1NHIBANT L'EXPRESSION DE LA PROTEINE OB- 
RGRP ET PROCEDE DE DETECTION DE COMPOSES MODIFIANT L'INTERACTION 
ENTRE LES PROTEINES DE LA FAMILLE DE OB-RGRP ET LE RECEPTEU R DE LA 

LEPTINE 

4 

La presente demande a pour objet des oligonucleotides antisens inhibant 
I'expression de la proteine OB-RGRP et leurs utilisations pour la prevention et / 
ou le traitement de pathologies liees a la leptine. 

Elle est en outre relative a un procede de detection de ligands du recepteur de 
la leptine par mise en ceuvre du transfert d'energie entre d'une part des 
proteines de fusion composees de recepteurs de la leptine et de proteines 
donneurs ou accepteurs d'energie et d'autre part de des proteines de fusion 
composees de OB-RGRP. ou de MY047 et de proteines donneurs ou 
accepteurs d'energie. 

Elle a de plus pour objets des proteines de fusion pour la mise en oeuvre de ce 
procede. 

La leptine est une proteine de 16 kDa secretee principalement par le tissu 
adipeux, et se liant a un recepteur (OB-R) appartenant a la famille des 
recepteurs aux cytokines. Cinq isoformes membranaires de ce recepteur ont 
ete identifies, et derivent de I'epissage alternatif d'un meme gene. Ces 
isoformes qui possedent le meme domaine extracellulaire et 
transmembranaire, sont caracterisees par des domaines intracellulaires de 
tailles variables(Tartaglia et al. (1995) Cell 83, 1263-1271). Une forme soluble 
du recepteur a aussi ete identifiee et provient d'un epissage alternatif ou d'un 
clSvage proteolytique du domaine extracellulaire des formes membranaires. La. 
forme courte du recepteur (OB-Rs) qui semble impliquee dans le transport de 
la leptine au travers de la barriere hemato-encephalique est I'isoforme la plus 
exprimee. La forme longue (OB-RI) est seulement exprimee dans quelques 
tissus comme ('hypothalamus et semble responsable de la plupart des effets 
biologiques de la leptine (Sweeney, G. (2002) Cell Signal 14, 655-663). La 
leptine et son recepteur ont ete I'objet d'une attention particuliere a cause de 
leur implication dans la regulation de la balance energetique, du metabolisme, 
et dans la response neuroendocrine a la prise alimentaire. Recemment, il a ete 
montre que la leptine est aussi impliquee dans des fonctions additionnelles 
importantes comme la regulation de la masse osseuse, I'angiogenese, la 
formation de thrombus, la maturation sexuelle, I'hematopoTese, la regulation de 
I'immunite et de I'inflammation, le developpement foetal et le cancer. 
L'administration de leptine chez des organismes deficients en leptine comme 
les souris (ob/ob) et certains individus humains provoque une diminution de la 
masse de lipide dans divers tissus comme le foie et le tissu adipeux (Halaas et 
al. (1995) Science 269, 543-546, Pelleymounter et al. (1995) Science 269, 
540-543, Campfield et al. (1995) Science 269, 546-549, Farooqi et al. (1999) N 
Engl J Med 341, 879-884). Ce traitement par la leptine ameliore aussi la 
sensibilite a I'insuline et diminue la masse grasse chez la souris et I'homme 
presentant une lipodistrophie(Shimomura et al. (1999) Nature 401, 73-76, Oral 
et al. (2002) New England Journal of Medicine 346, 570-578, Petersen et al. 
(2002) J Clin Invest 109, 1345-1350 . Les personnes obeses sont 
generalement resistantes a la leptine. Les raisons de cette resistance sont 
encore mal comprises mais plusieurs mecanismes ont ete suggeres : un defaut 
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de transport de la leptine au travers de la barriere hemato-encephalique, un 
defaut d'activation des OB-R ou de la signalisation de ces recepteurs; et la 
surexpression de regulateurs negatifs comme SOCS3 et PTP-1B Bjorbaek et 
al. (2000) J Biol Chem 275, 40649-40657, Cheng et al. (2002) Developmental 
Cell 2, 497-503, Cook et Unger (2002) Developmental Cell 2, 385-387. La, 
comprehension des mecanismes de la resistance a la leptine requiert une 
caracterisation plus detaillee des mecanismes impliques dans I'activation des~ . 
OB-R. 

OB-R est constitutivement associe a la janus kinase 2 (JAK2). La liaison de 
JAK2 au recepteur est critique pour la signalisation par les OB-R et a ete* 
proposee comme etant impliquee dans la stabilisation des dimeres de 
recepteurs OB-R. L'activation par des agonistes provoquerait un changement 
de conformation dans la region juxta membranaire de la queue cytoplasmique 
des OB-R. JAK2, qui est constitutivement reliee au motif boxl dans cette 
region est activee par autophosphorylation puis phosphoryle le recepteur OB- 
Rl mais pas OB-Rs. La phosphorylation d'OB-RI permet I'ancrage de proteines 
STAT qui se lient au recepteur et son activees par phosphorylation sur 
tyrosine. Les proteines STAT activees dimerisent et transloquent dans le 
noyau pour stimuler la transcription de genes via des element de reponse aux 
STAT Tartaglia (1997) J Biol Chem 272, 6093-6096. 

Recemment, un second promoteur pour le recepteur de la leptine a ete 
decouvert. De fagon interessante, un second transcrit est co-exprime avec les 
messagers des OB-R depuis ce promoteur. Ce transcrit a ete observe dahs 
plusieurs especes comme la souris, le rat, rhomme,. .* la levure et 
e/egansBailieul et al. (1997) Nucleic Acids Res 25, 2752-2758 . Des 
experiences d'hybridation in situ confirment la co-expression des OB-R et du 
gene associe dans le cerveau de la souris y compris les regions 
hypothalamiques impliquees dans la regulation du poids corporel (Mercen^et 
al., J Neuroendocrinol 2000 Jul;12(7):649-55). La proteine correspondante :^st 
composee de 131 acides amines et est appelee OB-R-gene related protein 
(OB-RGRP). Cette proteine a fait Tobjet de la demande de brevet 
WO98/05792. 

Le fait qu'OB-RGRP soit exprimee chez la levure et le nematode, organismes 
depourvus de recepteurs de la leptine, indique un role plus general pour OB- 
RGRP, supporte par la deletion de cette proteine chez la levure qui provoque 
un defaut de transport des proteines du golgi vers les vacuolesBelgareh-Touze 
et al. (2002) Molecular Biology Of The Cell 13, 1694-1708) . 
En 2001, un ADNc appele MY047, a ete clone a partir d'une banque d'ADNc 
de cerveau humain (16). La fonction de la proteine correspondante est encore 
inconnue. MY047 a 68 % d'homologie avec OB-RGRP suggerant que ces 
deux proteines appartiennent a la meme famille. L'analyse des sequences 
disponibles du projet de sequengage du genome humain montre qu'il n'existe 
aucun autre homologue. 

Les demandeurs se sont attaches a determiner le role de la OB-RGRP et ses 
relations avec les recepteurs de la leptine. 
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lis ont ainsi montre la specif icite des interactions entre la OB-RGRP et le 
recepteur OBRs. 

lis' ont en outre montre qu'il etait possible de modifier specifiquement 
I'expression des recepteurs de la leptine a la surface cellulaire a Taide d' 
oligonucleotides antisens diriges contre la proteine associee au gene des 
recepteurs de la leptine (OB-RGRP). 

La presente a done pour objet des oligonucleotides eventuellement modifies 
comprenant de 8 a 50 nucleotides qui hybrident de maniere specifique a la 
sequence SEQ ID N° 1 et inhibent I'expression de OB-RGRP. 
Avantageusement, ces oligonucleotides favorisent I'expression des recepteurs 
de la leptine a la surface cellulaire. 

* 

Preferentiellement ces oligonucleotides sont des antisens. 
Preferentiellement ces oligonucleotides sont caracterises en ce qu'il 
comprenent une sequence presentant une identite d'au moins 60%, 70%, 80% 
ou 90% avec la sequence SEQ ID N° 2. 

« 

Selon un mode de mise en ceuvre avantageux ces oligonucleotides sont 
caracterises en ce que des nucleotides sont thioesterifies, 

Selon un autre mode de mise en oeuvre avantageux ces oligonucleotides sont 
caracterises en ce que des nucleotides sont 2' O-methyles. 
Selon un autre mode de mise en ceuvre avantageux ces oligonucleotides sont. 
caracterises en ce qu'il presentent un residu triethyleneglycol a leurs 
extremites 3'. 

Bien que la forme la plus usitee de composes antisens se presente sous la 
forme d'oligonucleotides antisens, la presente invention inclut les derives 
d'oligonucleotides et les composes mimant leur structure tels que ceux decrits 
ci-apres, sans que cette liste soit limitative. Les composes antisens en accord 
avec cette invention comprennent de preference, de 8 a 50 nucleobases (e'est- 
a-dire sont des oligomeres formes de 8 a 50 unites nucleotidiques). Les 
composes antisens particulierement vises sont les oligonucleotides antisens, 
plus specialement ceux qui sont formes d'environ 12 a 30 nucleobases. Les 
composes antisens comprennent les ribozymes, les oligozymes et autres ARN 
catalytiques courts ou oligonucleotides catalytiques qui s'hybrident avec Tacide 
nucleique cible et modulent son expression. Un nucleoside est une 
combinaison d'une base azotee et d'un sucre. La base d'un nucleoside est 
generalement une base azotee heterocyclique. Les deux types de base 
heterocycliques les plus communs sont les bases puriques et pyrimidiques. 
Les nucleotides sont des nucleosides qui portent un groupement phosphate lie 
de maniere covalente au sucre du nucleoside. Pour les nucleosides 
comportant un pentanofurannose, le phosphate peut etre lie a I'hydroxyle en 
position 2\ 3' ou 5 1 du. sucre. La formation de nucleotides provient de 
Tattachement covalent du groupement phosphate a deux nucleosides 
adjacents ce qui permet de proche en proche Tobtention d'un oligomere 
lineaire. Les deux extremites d'un tel polymere lineaire peuvent a leur tour se 
joindre pour former une structure circulaire, mais la structure ouverte est 



1 er depot 



4 

generalement preferee. Dans la structure nucleotidique, les groupements 
phosphate sont consideres comme formant le squelette internucleosidique de 
('oligonucleotide. La liaison normale dans le squelette d f ARN ou d'ADN est un 
lien phosphodiester 3'-5\ Des exemples specifiques de composes ahtisens 
utilisables dans cette invention incluent des oligonucleotides contenant une 
ossature modifiee ou des liaisons internucleosidiques non-naturelles. Ainsi des 
oligonucleotides a ossature modifiee comprennent ceux qui conservent un 
atome de phosphate dans leur squelette et ceux qui en sont depourvus. Pour 
les besoins de la presente invention, des oligonucleotides modifies ne 
possedant pas d'atome de phosphore dans leur liaison internucleosidique 
peuvent malgre tout etre consideres comme des oligonucleotides. L'ossature 
de ces oligonucleotides modifies peut comprendre par exemple /des 
groupements phosphorothioates, phosphorothioates chiraux, phosphoro- 
dithioates, phosphotriesters, aminoalkylphosphotriesters, methyl et autres alkyl 
phosphonates y compris les 3'-alkylene phosphonates, 5'-'alkylene 
phosphonates et phosphonates chiraux, des groupements phosphinates, 
phosphoramidates y compris 3'-amino phosphoramidate and 
aminoalkylphosphoramidates, thionophosphoramidates, 
thionoalkylphosphonates, thionoalkylphosphotriesters, selenophosphates and 
borophosphates formant des liaisons normales, 3'-5\ et leurs analogues 
formant des liasons 2-5', ainsi que ceux qui presentent une polarite inversee, 
c'est-a-dire comprenant au moins une liaison internucleosidique de type 3'-3\ 
5'-5' ou 2*-2\ La forme d'oligonucleotides possedant une polarite inversee 
preferentieilement utijisee est celle possedant la premiere liaison 
internucleosidique en 3' est de type 3'-3\ Ceci correspond a un seul residu 
nucleosidique inverse, qui peut par ailleurs etre abasique, c'est-a-dire dans 
lequel la base azotee heterocyclique est manquante ou remplacee par, un 
groupement hydroxyle. Les diverses formes (salines ou acide libre) spnt 
incluses dans le champ de cette invention. 

L'ossature des oligonucleotides modifies depourvus d'atome de phosphore^est 
preferentieilement formee de courtes chaines alkyles ou cycloalkyles, y 
compris leurs derives comportant un ou plusieurs heteroatomes, servant de 
liaison internucleosidique. Ce type d'ossature peut etre a base de liaison 
morpholino (constituee en partie par le sucre du nucleoside), de siloxane, de 
formacetyle et thioformacetyle, de methylene formacetyle et methylene 
thioformacetyle, de riboacetyle, d'alcenes, de sulfamates, de sulfonate et 
sulfonamide, de methylene imine et methylene hydrazine, d'amide, et de tout 
autre groupement comportant divers atomes d'azote, de soufre et d'oxygene 
ou des groupes methyle. 

Pour d'autres analogues d'oligonucleotides, le sucre et la liaison 
internucleosidique (c'est-a-dire Tossature) sont a la fois remplaces dans la 
structure nucleotidique par de nouveaux groupes. La base azotee 
heterocyclique est conservee pour assurer I'hybridation avec I'acide nucleique 
cible. De tels composes oligomeres, les PNA (pour Peptide Nucleic Acid), ont 
montre une excellente capacite d'hybridation. Dans ces composes, le squelette 
de ('oligonucleotide est remplace par une ossature a base d'amide, en 
particulier par I'aminoethyl glycine, greffee directement ou indirectement sur les 
bases azotees. De plus amples renseignement sur ces PNA peuvent etre 
trouves dans Nielsen et al., Science, 1991, 254, 1497. 
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L'invention incorpore plus particulierement des oligonucleotides a ossature 
phosphorothioate, amide et morpholine, et les oligonucleosides a squelette a 
heteroatomes, plus precisement : 
-CH2-NH-0-CH2- 

5 -CH2-N(CH3)-0-CH2- (denomme squelette methylene-(methylimino) ou MMI) 
-CH2-0-N(CH3)-CH2- 
-CH2-N(CH3)-N(CH3)-CH2- 

-0-N(CH3)-CH2-CH2- (dans lequel le pont phosphodiester est : 0-P-0-CH2). 

10 . V La modification des oligonucleotides peut egalement porter sur les sucres : les 
* . substitutions preferees sont en position 2' (F; derives O-, N- ou S-alcanes, O-, 

N- ou S-alcenes ou O-, N- ou S-alcynes de longueur C1 a C11, substitues ou 

noh) en particulier, les derives preferes sont : 

0-[(CH2)nO]m-CH3 
15 0-(CH2)n-0-CH3 

0-(CH2)n-NH2 

0-(CH2)n-CH3 
: 0-(CH2)n-0-NH2 

0-(CH2)n~0-N[(CH2)n-CH3]2 
20 ou n et m varient de 1 a 10. 

D'autres modifications de la position 2' incluent les groupes suivants : chaines 

aliphatiques substitutes ou non de longueur C1 a C10 5 aryles, aryles-alkyles et 

alkyles-aryles; -SH, -SCH3, -OCN, -CI, -Br, -CN, -CF3, -OCF3, -S02CH3, - 

ON02, -N02, -N3, -NH2; silyles substitues; groupement "rapporteur"; 
25 groupement intercaleur; groupement de clivage de TARN; groupement pour 

ameliorer les capacites pharmacodynamiques d f un oligonucleotide. Les 

modifications preferees incluent les groupements : 

2'-methoxyethoxy (2^0-CH2CH20CH3, egalement appele 2'-0-(2- 
methoxyethyl) ou 2-MOE) (Martin et al., Helv. Chim. Acta, 1995, 78f 486-504) 
30 2 , -dimethylaminooxyethoxy (0(CH2)20N(CH3)2 , egalement appele 2'- 
DMAOE 

2 , -dimethylaminoethoxyethoxy (2'-0-CH20CH2-N(CH2)2, egalement appele 
2*-dimethylaminoethoxyethyl or 2*-DMAEOE). 

Une autre modification interessante conduit a la formation de LNA (Locked Nucleic 
35 Acids) dans lesquels I'hydroxyle en position 2 # est lie au carbone en position 3' ou 

4' du sucre, formant alors un sucre a structure bicyclique. Le pontage prefere se 

fait par un lien methyle ou ethyle entre I'oxygene 2' et le carbone en 4\ 

D autres substitutions preferees en position 2* incluent : 

-0-CH3 (2'-methoxy) 
40 -0-(CH2)3-NH2 (2'-aminopropoxy) 

-CH2-CH=CH2 (2-allyle) 

-0-CH2-CH=CH2 (2'-0-allyle) 

-F (Z fluoro). 

Ces modifications en 2' peuvent se presenter en position ribo (bas) ou arabino 
45 (haut). Le substituant 2 fluoro est le prefere en position arabino. 

Des modifications similaires peuvent etre faite sur d'autres positions, en particulier 
en position 3" du sucre du nucleotide en extremite 3'-terminale ou dans les 
oligonucleotides a ossature 2 f -5\ et en position 5' du sucre en extremite 5 f - 
terminale. Les sucres des oligonucleotides peuvent egalement etre remplaces par 
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des analogues (par exempte un cyclobutyl peut etre substitue a un pentofurranyl). 



Les oligonucleotides peuvent aussi comporter des modifications ou substitutions 

5 au niveau des nucleobases (bases heterocycliques azotees appelees "bases" par 
rhomme de Tart). Les bases naturelles (non modifiees) sont les purines (adenine 
A et guanine G) et les pyrimidines (cytosine C, thymine T et uracile U). Parmi les 
bases modifiees sont inciuses des molecules naturelles ou synthetiques telles que 
5-methylcytosine, 5-hydroxymethylcytosine, xanthine, hypoxanthine, 2- 

10 aminoadenine; 6-methyl, 2-methyl et autres derives alkyles des bases puriques (A 
et G); derive 2-thio (C, T et U); derive 5-halo (U, C); derive 5-propynyl (U et C) 
cytosine; derive 6-azo (U, Tet C); 5-uracile; 4-thiouracile; 8-halo, 8- amino, 8-thiol, 
8-thioalkyl, 8-hydroxyl autres adenines et guanines substitutes en position 8; 5- 
halo (en particulier 5-bromo), 5- trifluoromethyl et autres uraciles and cytosines 

15 substitutes en position 5; 7-methylguanine and 7-methyladenine; 2-fluoro- 
adenine; 2-amino-adenine; 8-azaguanine et 8-azaadenine; 7-deazaguanine et 7- 
deazaadenine; 3-deazaguanine et 3-deazaadenine. Dans les autres bases 
modifiees, on trouve les pyrimidines tricycliques telles que phenoxazine 
cytidine(IH-pyrimido[5,4-b][ 1,4]benzoxazin-2(3H)- one), phenothiazine cytidine 

20 (1 H-pyrimido[5,4- b][1 ,4]benzothiazin-2(3H)-one), phenoxazine cytidine 
substitutes (comme la 9-(2-aminoethoxy)-H-pyrimido[5,4-b][1 ,4]benzoxazin-2(3H)- 
one), carbazole cytidine (2H- pyrimido[4,5-b]-indol-*2-one). 

Les bases modifiees comprennent les composes dont I'heterocycle purique our 
pyrimidique est remplace par un autre heterocycle par example 7-deaza-adeninefl 

25 7-deazaguanosine, 2-aminopyridine ou 2-pyridone (The Concise Encyclopedia Of 
Polymer Science And Engineering, pages 858-859" Kroschwitz, J. I., ed. John. 
Wiley & Sons, 1990; Englisch et al., Angewandte Chemie, International Edition^ 
1991, 30, 613; Sanghvi, Y.S., Chapter 15, Antisense Research and Applications^ 
pages 289-302, Crooke, ST. and Lebleu, B., ed., CRC Press, 1993). Certaines de^, 

30 ces bases modifiees peuvent etre d'un grand interet pour augmenter I'affinite de£ 
composes oligomeriques de Tinvention, comme les pyrimidines substitutes en 
position 5, les azapyrimidines, les purines N- et O- substitutes (telles que la 2- 
aminopropyladenine, la 5-propynyl uracile, la 5-propynyl cytosine). Les 5- 
mtthylcytosines substitutes ont un effet positif sur la stabilitt des duplex 

35 oligomeres-acides nucltiques (Sanghvif Y.S.f Crookef ST, and Lebleu, B.,r eds.f 
Antisense Research and Applications, -CRC Press, Boca Raton, 1993, pp. 276- 
278) et sont la substitution prtftrte, en particulier en combinaison avec les 
modifications 2 , -mtthoxyethyl des sucres. 

40 Prtftrentiellement ces oligonucltotides sont sous la forme simple brin. 

■ 

Selon un mode de mise en oeuvre particulierement avantageux ces 
oligonucltotides comprennent une stquence prtsentant une identitt d'au 
moins 60% avec la sequence SEQ ID N°2, dans laquelle les nucltotides en 
45 positions 2, 4, 6, 7, 9, 1 1 , 13, 15, 17, 19 et 20, dans le sens 5' vers 3\ sont 

thioesttrifits. 

♦ 

Selon un mode de mise en ceuvre particulierement avantageux ces 
oligonucltotides comprennent une stquence prtsentant une identitt d J au 
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' moins 60% avec la sequence SEQ ID N°2, dans laquelle les nucleotides en 
positions 1, 2, 3, 4, 5, 16, 17, 18, 19 et/ou 20 , dans le sens 5' vers. 3', .sont 2' 
O-methyles. ■ . . . 

5 '"'Preferentiellement les oligonucleotides selon la presente invention sont des 
ADN. 

■ « * 

La presente invention a encore pour objet des oligonucleotides de type ARNi 
(Acide Ribonucleique Interferant) comprenant de 15 a 25 nucleotides 
10 caracterises en ce qu'ils hybrident de maniere specifique a la sequence SEQ 
ID N° 21 et inhibent I'expression de OB-RGRP. 

Preferentiellement de tels ARNi comprennent 17 ou 19 nucleotides pris en 
% continu dans la sequence SEQ ID N° 21, ou dans sa sequence 
complementaire. Des nucleotides A(A/G) et (C/T)T peuvent etre ajoutes 
15 respectivement en 5' et en 3' de cette sequence de 17 ou 19 nucleotides. 

D'autres types de residus ou groupes chimiques peuvent neanmoins etre 
ajoutes a ces deux extremites, pour autant qu'ils ne diminuent pas I'activite des 
antisens. 

Les modifications de nucleotides decrites pour les antisens sont aussi 
20 possibles pour ceux entrant dans la composition des sARNi. 

La presente invention inclut egalement toutes modifications des antisens ou 
des ARNi, visant a augmenter la resistance de ces composes aux nucleases 
cellulaires, ou leur penetration dans les cellules et/ou leur efficacite dans le 
ciblage de la sequence d'OB-RGRP. 

25 

Lorsqu'ils sont des ADN, les oligonucleotides selon la presente invention peuvent 
etre realises commodement et en routine par la technique bien connue de la 
synthese en phase solide. L'equipement pour une telle synthese est vendu par 

30 differentes societes specialisees telles que Applied Biosystems (Foster City, CA). 
La synthese des antisens dans la presente invention a fait appel a une synthese 
chimique sur un support adapte selon les methodes connues de Thomme du 
metier, en particulier decrites par E. Uhlmann, A. Peyman, A: Ryte, A. Schmidt 
and E. Buddecke (1999, Methods in Enzymology 313: 26S-284)et par E. Uhlmann 

35 (Recent advances in the medicinal chemistry of antisense oligonucleotides,Current 
Opinion of Drug Discovery and Develepment 3: 203-213, 2000). Tout autre 
procede de synthese connu de Thomme du metier peut aussi etre employe. 

Lorsqu'ils sont des ARNi les oligonucleotides selon la presente invention peuvent 
40 etre synthetises par synthese chimique, lorsqu'il s'agit de ARNi synthetiques, ou 

exprirnes in situ a I'aide de vecteurs exprimant de tels oligonucleotides. 
- Les sARNi (petits ARNi) peuvent etre obtenus aupres de differents foumisseurs 

comme Protigo (Proligo France SAS 1 rue Robert et Sonia Delaunay 75011 Paris) 

Dharmacon (Dharmacon, Inc. 1376 Miners Drive #101 Lafayette, CO 80026) et 
45 Ambion (Ambion (Europe) Ltd. Ermine Business Park Spitfire Close Huntingdon, 

Cambridgeshire PE29 6XY United Kingdom), ou peuvent etre synthetises a partir 

de kits commercialises par differentes societes comme Dharmacon et Ambion. 

Preferentiellement les ARNi selon la presente invention sont sous forme double 

brin. 
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Apres synthese les, ARNi sont tout d'abord repris dans de I'eau depourvue de 
RNAses. L'appariement des deux molecules simple brin peut etre realisee comme 
suit : 20 pmol.L-1 de chaque brin est melange dans le tampon d'appariement (100 
mmol.L-1 d'acetate de potassium, 30 mmol.L-1 d'HEPES-KOH pH 7,4, 2 mmol.L-1 
5 d'acetate de magnesium) puis chauffe a 90°C pendant 1 min suivit par une 
incubation d'1 h a 37°C. 

La transfection des ARNis peut se faire par le meme protocole que pour la 
transfection des antisens. 

v 

T 

10 . , 

Une alternative pour le ARNi est ('utilisation de vecteurs permettant la synthese 
d'ARN antisens specifiques du gene a eteindre et qui vont s'apparier dans les 
cellules transferees pour donner un ARNis. Un premier systeme de vecteur 
permet r expression d'une sequence antisens par deux promoteurs en sens 

15 inverse, de chaque cote de cette sequence, donnant naissance £ deux ARN 
complementaires qui vont s'apparier dans les cellules transferees et donner un 
ARNis. Un autre systeme de vecteur met en jeu la synthese d'un ARN presentant 
la sequence de I'antisens suivie de la sequence sens, espacee par quelques 
nucleotides, qui va creer une structure d'ARN en epingle a cheveu, qui va etre 

20 clivee dans les cellules transferees pour donner un ARNis. La transfection de ces 
vecteurs s'effectue de maniere classique comme decrit ci-avant pour les differents 
ADN. L'obtention de lignees stables qui presentent une extinction du gene cibje 
est realisable par une selection par antibiotique classiquement utilisee paur 
Tobtention de lignees. - ' \; 

25 

De maniere generate, I'homme du metier peut se referer pour les ARNi aux 
publications suivantes : Elbashir S.M. et al. (2001, Nafure 411: 494-498), Elbas^ir 
S.M. Lendeckel W. and Tuschl T. (2001, Genes & Dev. 15:188-200) et Masters 
J.R.,et al. (2001 . Proc. Natl. Acad. Sci. USA 98: 8012-8017). 

30 ^ 
Des vecteurs permettant Texpression des ARNi peuvent etre obtenus comme 
decrit par Brummelkamp T.R., Bernards R., Agami R. (2002. Science 296: 550- 
553) et Yu J.Y., DeRuiter S.L., and Turner D. (2002,. Proc. Natl. Acad. Sci. USA . 
99: 6047-6052). 

35 \ 

De tels vecteurs, ainsi que des cellules contenant de tels vecteurs sont des 
objets de la presente demande. 

* " 
40 La presente a encore pour objet des medicaments contenant de tels 
oligonucleotides, vecteurs et cellules et des compositions pharmaceutiques 
contenant une quantite pharmacologiquement active de tels oligonucleotides, 
vecteurs et cellules et des excipients pharmaceutiquement acceptables. 

45 Un autre objet de la presente invention est ('utilisation de tels oligonucleotides, 
vecteurs et cellules pour la fabrication d'un medicament pour la prevention et / ou 
le traitement de pathologies liees a la leptine. 
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♦ 



Elle a de plus pour objet un procede de traitement curatif ou preventif de maladies 
liees a la leptine consistant a administrer de tels oligonucleotides, vecteurs et 
cellules a un patient atteint par la dite maladie. 1 - 

— - . * 

5. Un autre objet de I'invention est un procede de determination de la modification 
de Interaction entre la OB-RGRP ou la proteine MY047, ou une proteine 
presentant une identite d'au moins 65% avec cette proteine ou avec la 
proteine MY047, et le recepteur de la leptine par un compose. 

10 

Elle est en outre relative a des proteines de fusion pour la mise en oeuvre de ce 
procede, ainsi qu'a des acides nucleiques codant ces proteines. 

Elle a de plus pour objet un procede de traitement curatif ou preventif de maladies 
15 liees a la leptine consistant a administrer un ligand seiectionne par le procede 
defini ci-dessus a un patient atteint par la dite maladie. 

Un premier objet de la presente invention est done une proteine de fusion 
caracterisee en ce qu'elle est composee d'une sequence presentant une identite 
20 d'au moins 65% avec la sequence SEQ ID N°4, ou la sequence SEQ ID N°16, ou 
d'une partie substantielle de la sequence SEQ ID N°4 ou de la sequence SEQ ID 
N°16, et d'une proteine donneur d'energie ou accepteur d'energie, ou d'une partie 
substantielle et active d'une proteine donneur d'energie ou accepteur d'energie. 

25 Les proteines de fusion selon la presente invention sont composees en substance 
d'une partie correspondant a une partie ou la totalite d'une sequence presentant 
une identite d'au moins 65% preferentiellement d'au moins 75%, et encore plus 
preferentiellement d'au moins 85% ou 95%, avec la sequence SEQ ID N°4 ou la 
sequence SEQ ID N°16, ou d'une partie substantielle de la sequence SEQ ID N°4 

30 ou de la sequence SEQ ID N°16, et d'une partie correspondant a une proteine 
donneur ou accepteur d'energie. Elles peuvent neanmoins comprendre d'autres 
sequences d'acides amines, issues d^autres proteines, telles que des sequences 
'. signal. 

35 De maniere avantageuse la proteine donneur d'energie est la luciferase de 
Renilla. Elle peut neanmoins etre toute autre proteine donneur d'energie telle que 
le spectre d'emission du donneur chevauche suffisamment le spectre d'excitation 
de I'accepteur pour permettre un transfer! d'energie efficace entre les deux 
partenaires. Elle peut ainsi etre la GFP, si le transfert d'energie est le FRET, ou 

40 encore Taequorine si le transfert d'energie est le CRET. L'aequorine peut etre 
obtenue et uiilisee comme decrit dans la demande de brevet EPO 187 519, ou 
dans I'article de Inouye et aL (PNAS USA 82 : 3154-3158 (1985)). 

La proteine fluorescente accepteur d'energie est quant a elle preferentiellement la 
45 DsRed, la GFP ou un mutant de cette proteine, tel que la YFP, I'EYFP, la GFP 
sauvage, la GFPS65T, la Topaz, ou la GFP10. 

Elle peut neanmoins etre toute autre proteine fluorescente accepteur d'energie 
telle que le spectre d'excitation de I'accepteur et le spectre d'emission du donneur 
se chevauchent suffisamment pour permettre un transfert d 'energie efficace entre 
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les deux partenaires. 

Ces proteines sont connues de. rhomme du metier qui peut trouver leurs 
sequences dans la litterature, notamment dans le revue de Blinks et al. 

5 (Pharmacol. Rev. 28 : 1-93 (1976)). En particulier la GFP est decrite par Tsien 
(Annu. Rev. Biochem. 67 : 509-544 (1998)) et son clonage par Prasher et al: 
(Gene.1 11 : 229-233 (1992)). Le clonage de la DsRed est quant a lui decrit par 
Matz et al. (Nat. Biotechnol. 17 : 969-973 (1999)). Pour la Rluc, I'homme du metier 
peut se referer a Blinks et al. (Pharmacol. Rev. 28 : 1-93 (1976)) ou encore a 

10 Lorenz et al. (PNAS 88: 4438-4442 (1 991 )). 

{ 

De maniere particulierement avantageuse les proteines de fusion donneur et 
. accepteur presentent rune des sequences SEQID N°6, SEQID N°8, SEQID N°12, 
15 SEQID N°14, SEQID N°18 ou SEQID N°20.ou un variant de cette sequence 
presentant une identite d'au rnoins 65%. 



20 D'autres objets de la presente invention sont des acides nucleiques codant pour 
ces proteines. De tels acides nucleiques peuvent etre des ADN complementaires 
ou genomiques, ou des ARN. Ces acides nucleiques ou polynucleotides peuvent 
etre sous forme simple chame ou sous la forme de duplex. ^ 

25 lis sont de maniere particulierement avantageuse des ADN complementaires. 

De maniere preferentielle Tinvention a pour objet un acide nucleique ayant une 
identite d'au moins 65%, preferentiellement d'au moins 75%, et encore plus 
preferentiellement d'au moins 85% ou 95%, d'identite en nucleotides avecTun 
30 acide nucleique de sequence SEQID N°5, SEQID N°7, SEQID N°1 1 , SEQID 3, 
SEQID N°17 ou SEQID N°19. 

Selon encore un autre aspect, ^invention est relative a un acide nucleique 
hybridant, dans des conditions d'hybridation de forte stringence, avec un acide 
35 nucleique tel que defini ci-avant, et plus particulierement un acide nucleique de 
sequences nucleotidiques SEQID N°5, SEQID N°7, SEQID N°11, SEQID N°13, 
SEQID N°17 ou SEQID N°19, ou un acide nucleique de sequence 
complementaire. 

40 Le « pourcentage d'identite » entre deux sequences de nucleotides ou d'acides 
amines, au sens de la presente invention, peut etre determine en comparant deux 
sequences alignees de maniere optimale, a travers une fenetre de comparaison. 

La partie de la sequence nucleotidique ou polypeptide dans la fenetre de 
comparaison peut ainsi comprendre des additions ou des deletions (par exemple 

45 des « gaps ») par rapport a la sequence de reference (qui ne comprend pas ces 
additions ou ces deletions) de maniere a obtenir un alignement optimal des deux 
sequences. 

Le pourcentage est calcule en determinant le nombre de positions 
auxquelles une base nucleique ou un residu d'aminoacide identique est observe 
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pour les deux sequences (nucleique ou peptidique) comparees, puis en divisant le 
nombre de positions auquel il y a identite entre les deux bases ou residus 
d'aminoacides par le nombre total de positions dans la fenetre de comparaison, 
puis en multipliant le resultat par 100 afin d'obtenir le pourcentage d'identite de 
5 sequence. 

, L'alignement optimal des sequences pour la comparaison peut etre realise 
de maniere informatique a I'aide d'algorithmes connus contenus dans le package 
de la Societe WISCONSIN GENETICS SOFTWARE PACKAGE, GENETICS 
COMPUTER GROUP (GCG), 575 Science Doctor , Madison, WISCONSIN. 

10 A titre d'illustration, le pourcentage d'identite de sequence pourra etre 

effectue a I'aide du logiciel BLAST (versions BLAST 1.4.9 de mars 1996, BLAST 
2.0.4 de fevrier 1998 et BLAST 2.0.6 de septembre 1998), en utilisant 
exclusivement les parametres par defaut (S. F Altschul et al, J. Mol. Biol. 1990 
215 : 403-410, S. F Altschul et al, Nucleic Acids Res. 1997 25 : 3389-3402). Blast 

15 recherche des sequences similaires/homologues a une sequence « requete » de 
reference, a i'aide de I'algorithme d'Altschul et al. La sequence requete et les 
bases de donnees utilisees peuvent etre peptidiques ou nucleiques, toute 
combinaison etant possible. 

20 Par « conditions d'hybridation de forte stringence » au sens de la presente 

invention, on entendra les conditions suivantes : 
1- Competition des membranes et PRE HYBRIDATION : 

-Melanger: 40pl ADN sperme de saumon (10mg/ml)+ 40 \j\ ADN placentaire 
humain (10mg/ml) 
25 - Denaturer 5 min a 96°C, puis plonger dans la glace le melange. 

- Oter le SSC 2X et verser 4 ml de mix formamide dans le tube d'hybridation 
contenant les membranes. 

- Ajouter le melange des deux ADNs denatures. 

- Incubation a 42°C pendant 5 a 6 heures, avec rotation. 
30 2- Competition de la sonde marquee : 

- Ajouter a la sonde marquee et purifiee 10 a 50 pi ADN Cot I, selon la quantite de 
repetitions. 

- Denaturer 7 a 10 mn a 95°C. 

- Incuber a 65°C pendant 2 a 5 heures. 
35 3- Hybridation : 

- Oter le mix de pre hybridation. 

- Melanger 40 pi ADN sperme de saumon + 40 pi ADN placentaire humain ; 
denaturer 5 mn a 96°C, puis plonger dans la glace. 

- Ajouter dans le tube d'hybridation 4 ml de mix formamide, le melange des deux 
40 ADN et la sonde marquee/ADN Cot I denaturee. 

- Incuber 15 a 20 heures a 42°C; avec rotation. 

4- Lavages : 

- Un lavage a temperature ambiante dans du SSC 2X, pour rincer. 

- 2 fois 5 minutes a temperature ambiante SSC 2X et SDS 0,1% a 65°C. 
45 - 2 fois 15 minutes a 65°C SSC 1X et SDS 0,1% a 65°C. 

Envelopper les membranes dans du Saran et exposer. 

Les conditions d'hybridation decrites plus haut sont adaptees a I'hybridation 
dans des conditions de forte stringence, d'une molecule d'acide nucleique d'une 
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longueur variable de 20 nucleotides a plusieurs centaines de nucleotides. . 

II va sans dire que les conditions d'hybridation ci-dessus decrites peuvent 
etre adaptees en fonction de la longueur de I'acide nucleique dont I'hybridation est 
recherchee ou du type de marquage choisi, selon des techniques connues de 

5 Thornme du metier. 

Les conditions convenables d'hybridation peuvent par exemple etre* adaptees 
selon I'enseignement contenu dans I'ouvrage. de HAMES et HIGGINS 
(1985,"Nucleic acid hybridization : a practical approach", Hames and Higgins Ed.,. 
IRL Press, Oxford) ou encore dans I'ouvrage de F.AUSUBEL et al (1989, Current 

10 Protocols in Molecular Biology, Green Publishing Associates and Wiley 
Interscience, N.Y). 

f 

mm * 
B * 

Les proteines objets de la presente invention peuvent etre obtenues.par tous 
moyens connus de rhomme du metier. Elles sont neanmoins avantageusement 
15 obtenues par expression des acides nucleiques tels que decrits ci-dessus, codant 
pour ces proteines, eventuellement inseres dans des vecteurs d'expression, dans 
des cellules avantageusement choisies, suivie eventuellement par une extraction 
et une purification qui peut etre totale ou partielle. 

L'invention est egalement relative a un vecteur recombinant comprenant un 
acide nucleique selon l'invention. 

Avantageusement, un* tel vecteur recombinant comprendra un acide 
nucleique choisi parmi les acides nucleiques suivants : 4 

a) un acide nucleique codant pour une proteine ayant au moins 6j5% 
d'identite en acides amines avec une sequence SEQID N°6, SEQID N°8,SEQID 
N°18 ou SEQID N°20 ou un fragment peptidique ou un variant de cette derniere ; 

b) un acide nucleique comprenant un polynucleotide ayant une sequence 
SEQID N°5, SEQID N°7, SEQID N°17 ou SEQID N°19, ou un fragment ou*un 
variant de ce dernier; A 

c) un acide nucleique ayant au moins 65% d'identite en nucleotides avec.un 
acide nucleique ayant une sequence SEQID N°5, SEQID N°7, SEQID N°17 ou 
SEQID N°19 ou un fragment ou un variant de ce dernier ; 

d) un acide nucleique hybridant, dans des conditions d'hybridation de forte 
stringence, avec un acide nucleique de sequences SEQID N°5, SEQID N°7, 
SEQID N°17 ou SEQID N°19, ou un fragment ou un variant de ce dernier. 

Par « vecteur » au sens de la presente invention on entendra une molecule 
d'ADN ou d'ARN circulaire ou lineaire qui est indifferemment sous forme de simple 
brin ou double brin. 

40 Selon un mode de realisation, le vecteur d'expression comprend, outre un 

acide nucleique conforme a l'invention, des sequences regulatrices permettant 

d'en diriger la transcription et/ou la traduction. 

Selon un mode de realisation avantage'ux, un vecteur recombinant selon 

l'invention comprendra notamment les elements suivants : 
45 (1) des elements de regulation de Texpression de I'acide nucleique a 

inserer, tels que des promoteurs et des enhanceurs ; 

(2) la sequence codante comprise dans I'acide nucleique conforme a 

l'invention a inserer dans un tel vecteur, ladite sequence codante etant placee en 

phase avec les signaux de regulation decrits aux (1 ) ; et 



20 
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• (3) des sequences d'initiation et d'arret de la transcription appropriees. 

*" ' En outre, les vecteurs recombinants selon 1'invention pourront inclure une 
ou'plusieurs origines de replication chez les hotes cetlulaires dans lesquels leur 
5 , - amplification ou leur expression est recherchee, des marqueurs ou des marqueurs 
de selection. 

A titre d'exemples, les promoteurs pour cellules eucaryotes comprendront 
le promoteur de la thymidine kinase du virus HSV ou encore le promoteur de la 
metallothioneine-L de souris. 
10 ^.De maniere generate,- pour le choix d'un promoteur adapte, I'homme du 

metier pourra avantageusement se referer a I'ouvrage de SAMBROOK et al. 
(1989, " Molecular Cloning : A Laboratory Manual, " 2 nd ed., Cold Spring Harbor 
Laboratory Press, Cold Spring Harbor, NY.) ou encore aux techniques decrites par 
FULLER et al. (1996, Immunology in Current Protocols in Molecular Biology, 

15 Ausubel et al). 

Les vecteurs preferes selon 1'invention sont des plasmides, tels que par 

exemple les vecteurs pCDNA3 (I nvitrogen), pQE70, pQE60, pQE9 (Qiagen), 

psiX174, pBluescript SA, pNH8A, pNH16A, pNH18A, pNH46A, pWLNEO, 

pSV2CAT, pOG44, pXTI, pSG(Stratagene). 
20 II peut s'agir egalement de vecteurs de type baculovirus tel que le vecteur 

pVL1 392/1 393 (Pharmingen) utilise pour transfecter les cellules de la lignee Sf9 

(ATCC N°CRL 171 1) derivees de Spodoptera frugiperda. 

II peut encore s'agir de vecteurs adenoviraux tels que Tadenovirus humain 

de type 2 ou 5. 

25 Un vecteur recombinant selon 1'invention peut aussi etre un vecteur 

retroviral ou encore un vecteur adeno-associe (AAV). De tels vecteurs adeno- 
associes sont par exemple decrits par FLOTTE et al. (1992, Am. J. Respir. Cell 
Moi Biol., 7 : 349-356 

La presente invention a en outre pour objets des cellules comprenant une 
30 proteine, un acide nucleique ou un vecteur tels que decrits ci dessus, ou des 
fragments de ces cellules, des lysats de ces cellules ou encore des membranes 
de ces cellules. 

De telles cellules peuvent etre cellules isolees d'un organisme et cultivees dans un 
35 milieu de croissance adequat. Elles sont neanmoins preferentiellement des 
lignees cellulaires. Ainsi de telles lignees sont de maniere particulierement 
avantageuse les lignees cellulaires HEK 293, COS (ATCC N°CRL 1650), COS-M6 
et HeLa (ATCC N°CCL2), ou encore Cv 1 (ATCC N°CCL70), Sf-9 (ATCC N°CRL 
1711), CHO (ATCC N°CCL-61) ou 3T3 (ATCC N°CRL-6361). 

40 

Les membranes de ces cellules peuvent etre preparees par toute methode connue 
de I'homme du metier. 

Preferentiellement elles seront preparees par broyage mecanique des cellules 
puis centrifugation des suspensions obtenues, comme illustre dans les exemples 
45 qui suivent. 

La presente invention est en outre relative a des compostions comprenant des 
cellules telles que decrites ci dessus et de la saponine. 



fa 



7* 



1er depot 



14 



La presente invention est en outre relative a un procede de determination de 
la modification de ('interaction entre la OB-RGRP, la proteine MY047, ou une 
proteine presentant une identite d'au moins 65% avec la sequence SEQ ID 
N°4 ou la sequence SEQ ID N°16, et le recepteur de la leptine par un 
5 compose comprenant les etapes consistant a : 

-mettre en contact ledit compose avec une proteine presentant une identite 
d'au moins 65% avec la sequence SEQ ID N°4 ou la sequence SEQ ID N°16, 
et le recepteur de la leptine, ou des cellules, ou des fragments, ou des lysats, 
ou des membranes de cellules comprenant de telles proteines, et 
10 eventuellement un substrat enzymatique adequat, et 

-a mesurer Interaction entre une proteine presentant une identite d'au 
moins 65% avec la sequence SEQ ID N°4 ou la sequence SEQ ID N°16, 
et le recepteur de la leptine. 

15 De maniere preferentielle, ledit compose est mis en contact avec une proteine de 
fusion donneur d'energie, et une proteine de fusion accepteur d'energie, ou des 
cellules, ou des fragments, ou des lysats, ou des membranes de cellules 
comprenant une telle proteine, et eventuellement un substrat enzymatique 
adequat 

20 

Preferentiellement ledit procede est mis en oeuvre avec des cellules traitees par 
un agent permeabilisant les cellules tel que la saponine. 

Les proteines de fusion donneur d'energie et les proteines de fusion accepteur 
d'energie sont choisies de maniere a ce que I'energie resultant de 1'activation du 
25 donneur puisse etre transferee de maniere efficace a I'accepteur. * 

Dans un mode de mise en oeuvre avantageux dudit procede, la proteine de fusjon 
donneur d'energie est une proteine de fusion avec la luciferase ou une partie 
substantielle de la luciferase, auquel cas le substrat est avantageusemenf la 
30 coelenterazine. 

Dans un mode de mise en oeuvre preferentiel dudit procede, la proteine de fusion 
accepteur d'energie est une proteine de fusion avec la YFP ou une partie 
substantielle de la YFP. 

35 

Dans un mode de mise en oeuvre avantageux dudit procede, le transfert 
d'energie mesure en presence du compose a tester est compare a celui 
mesure en absence du compose a tester. 
40 Dans un autre mode de mise en oeuvre avantageux dudit procede le transfert 
d'energie mesure en presence du compose a tester et de la leptine (ou un 
ligand du recepteur), est compare a celui mesure en presence du compose en 
absence de leptine (ou un ligand du recepteur). 

45 

Preferentiellement le procede est mis en oeuvre sur des membranes des cellules, 
telles que decrites ci dessus. 

De maniere preferentielle les proteines donneur et accepteur selon la presente 
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invention sont choisies afin que le transfert d'energie se fasse par BRET (pour 
Bioluminescence Resonance Energy Transfer ou ou transfert d'energie de 
bioluminescence par resonance) de premiere ou deuxieme generation, ou LRET 
(pour Luminescence Resonance Energy Transfer ou ou transfert d'energie de 

5 luminescence par resonance). Neanmoins un tel transfert d'energie peut etre 
effectue par FRET (pour Fluorescence Resonance Energy Transfer ou transfert 
d'energie de fluorescence par resonance) ou encore par CRET (pour 
Chemioluminescence Resonance Energy Transfer ou transfert d'energie de 
chimioluminescence par resonance). 

10 Quelque soit le type de transfert d'energie les couples proteine de fusion donneur/ 
proteine de fusion accepteur d'energie sont choisis afin de permettre un tel 
transfert. 

Le BRET2 (2eme generation) consiste en un transfert d'energie entre la luciferase 
de Renilla , et une GFP mutante, la GFPio, utilisant un substrat adequate, la 
15 coelanterazine DeepblueC™ (Biosignal Packard). 

Le CRET consiste en un transfert d'energie entre I'aequorine, qui est une 
luciferase, et la GFP. 

Le FRET consiste en un transfert d'energie entre deux proteines de la famille des 
GFP ayant des spectres differents. 
20 Pour la mise en oeuvre de ces transferts I'homme du metier peut se referer a 
Ramsay D et al. (Biochem J 365: 429-40 (2002)) et a Yoshioka K et al. (FEBS Lett 
523: 147-151 (2002)) pour le BRET2, a Baubet et al. (PNAS USA 97 : 7260-7265 
(2000)) pour le CRET, a Matyus (J Photochem Photobiol B 12: 323-337 (1992)) et 
Pollok et Heim (Trends Cell Biol 9:57-60 (1 999)) pour le FRET. 

25 

Un autre objet de la presente invention est un procede de criblage ou de 
detection de composes destines a la prevention et / ou au traitement de 
pathologies liees a la leptine comprenant les etapes consistant a : 

30 -mettre en contact ledit compose avec une proteine presentant une identite 
d'au moins 65% avec la sequence SEQ ID N°4 ou la sequence SEQ ID N°16, 
et le recepteur de la leptine, ou des cellules, ou des fragments, ou des lysats, 
ou des membranes de cellules comprenant de telles proteines, et 
eventuellement un substrat enzymatique adequat, et 

35 -a mesurer ('interaction entre une proteine presentant une identite d'au moins 

65% avec la sequence SEQ ID N°4 ou la sequence SEQ ID N°16, et le 
recepteur de la leptine. 

Preferentiellement la proteine presentant une identite d'au moins 65% avec la 
40 sequence SEQ ID N°4 ou la sequence SEQ ID N°16 est la OB-RGRP ou 
MY047. - 



Le procede selon la presente invention est compatible avec les plaques a 96 ou 
45 384 puits generalement utilisees. II ne necessite pas ('utilisation de molecules 
radioactives, est sensible, reproductible, rapide et le resultat est facile a lire. Cette 
caracteristique est particulierement interessante pour la mise en oeuvre de 
criblage a grande echelle. 
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• La presente invention est en outre relative a I'utilisation de composes selectionnes 

par un procede consistant a : 

-mettre en contact ledit compose avec une proteine presentant une identite 
d'au moins 65% avec la sequence SEQ ID N°4 ou la sequence SEQ ID N°16, 
5 et le recepteur de la leptine, ou des cellules, ou des fragments, ou des lysats, 
ou des membranes de cellules comprenant de telles proteines, et 
eventuellement un substrat enzymatique adequat, et 

-a mesurer I'interaction entre une proteine presentant une identite d'au 
moins 65% avec la sequence SEQ ID N°4 ou la sequence SEQ ID N°16, 
10 et le recepteur de la leptine. ■■ > 

Elle a enfin pour objet un procede de traitement curatif ou preventif de maladies 
liees a la leptine ou a son recepteur comprenant les etapes de: 
-selection dudit compose par un procede consistant a : 
15 +mettre en contact ledit compose avec une proteine presentant une identite 
d'au moins 65% avec la sequence SEQ ID N°4 ou la sequence SEQ ID N°16, 
et le recepteur de la leptine, ou des cellules, ou des fragments, ou des lysats, 
ou des membranes de cellules comprenant de telles proteines, et 
eventuellement un substrat enzymatique adequat, et 
20 +a mesurer ('interaction entre une proteine presentant une identite d'au moins 
65% avec la sequence SEQ ID N°4 ou la sequence SEQ ID N°16, et le recepteur 

de la leptine H: 
-d'administration dudit compose a un patient atteint par la dite maladie. \ : 

25 

Des pathologies liees a la leptine peuvent etre des maladies liees a une diminution 
de la densite osseuse comme par exemple I'osteoporose ou a I'inverse celles liees 
a une calcification importante. v. 
Elles peuvent aussi etre des maladies ayant un effet sur le poids, telles qufi 
30 I'obesite, le diabete ou l anorexie. V- 
Elles peuvent aussi etre des maladies ayant un effet sur la maturation sexuelle 
I'hematopoTese, I'angiogenese, la formation de thrombus, la regulation de 
I'immunite et de rinflammation, le developpement fcetal et le cancer. 

35 Les composes de I'invention, oligonucleotides, ARNi, ou autres composes, 
peuvent etre formules dans des compositions pharmaceutiques en vue d'une 
administration par voie topique, orale, parenteral, intranasal, intraveineuse, 
intramusculaire, sous-cutanee, intraoculaire, etc. Preferentiellement, les 
compositions pharmaceutiques contiennent des vehicules pharmaceutiquement 

40 acceptables pour une formulation injectable. II peut s'agir en particulier de 
solutions salines (phosphate monosodique, disodique, chlorure de sodium, 
potassium, calcium ou magnesium, etc, ou des melanges de tels sels), steriles, 
isotoniques, ou de compositions seches, notamment lyophilisees, qui, par addition 
selon le cas d'eau sterilisee ou de serum physiologique, permettent la constitution 

45 de solutes injectables. 

La formulation de compositions therapeutiques et leur administration est dans les 

competences de I'homme du metier. 

La formulation des composes peut inclure differents produits connus de I'homme 
du metier. Preferentiellement, les composes peuvent etre par exemple additionnes 
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» - ■ 

de sels, comme le sodium, le potassium, I'ammonium, le magnesium, le calcium, 
les polyamines, I'acide hydrochlorique, hydrobromique, sulfurique, phosphorique, 
ou nitrique. D'autres sels sont egalement utilisables, comme ceux provenant de 
I'acide acetique, oxalique, tartrique, succinique, maleique, fumarique, gluconique, 
5 citrique, malique, ascorbique, benzoique, tannique, palmitique, alginique, 
polyglutamique, naphtalenesulfonique, methanesulfonique, p-toluenesulfonique, 
naphtalenedisuifonique, polygalacturonique. Enfin, on peut aussi 
preferentiellement utiliser des sels de chlorine, bromine et iodine. 

10 La composition et la formulation pour I'administration topique peuvent inclure des 
patches transdermiques, des pommades, des lotions, des cremes, des gels, des 
gouttes', des suppositoires, des sprays, des liquides et des poudres. 

.La composition et la formulation pour I'administration orale peuvent inclure des 
15 poudres, des granules, des microparticules, des nano particules, des suspensions, 
des solutions aqueuses ou non, des capsules, des capsules de gel, des sachets, 
des tablettes ou mini tablettes. Des epaississants, des aromes, des diluants, des 
emulsifieurs, des aides a la dispersion ou des liants peuvent etre ajoutes. 

20 La composition et la formulation pour I'administration parenteral, intrathecal ou 
intra ventriculaire, peut inclure des solutions aqueuses steriles qui peuvent aussi 
contenir des tampons, des diluants et autres additifs comme, mais non limite a des 
agents augmentant la penetration, des produits transporters et des excipients. 

» 

25 La composition peut-etre formulee et utilisee comme une mousse, une emulsion, 
une microemulsion, des liposomes cationique, sensibles au pH ou negativement 
charges, et des transferomes. 

D'une fagon generate, les differentes formulations peuvent contenir un melange 
30 d'un ou plusieurs agents, comme mais non limite a des agents augmentant la 
penetration du compose (surfactants, sels biliaires, agents chelateurs, surfactant 
non chelateurs), des excipients (liants, remplisseurs, lubrifiants, desintegrants, 
agents mouiilant), des transporters (eau, solutions salines, alcools, polyethylene 
glycol, gelatine, lactose, amylose, stearate de magnesium, talc, acide silicique, 
35 paraffine visqueuse, hydroxymethylcellulose, polyvinylpyrrolidone).^ D'autres 
composants peuvent etre ajoutes, comme des colorants, des aromes, des 
conservateurs, des antioxydants, des opacifieurs, des agents epaississeurs et des 
stabilisateurs. 

40 Le dosage est dependant de la severite et de la sensibilite de I'etat de la maladie a 
traiter, avec une duree de traitement pouvant aller de quelques jours a quelques 
mois, ou jusqu'a ce que la cure soit efficace ou qu'une diminution de la maladie 
soit observee. Le dosage optimal peut etre calcule a partir de mesures 
d'accumulation de I'agent therapeutique dans le corps du patient. L'homme du 

45 metier peut facilement determiner les dosages optimum, les methodes de dosage 
et les taux de repetitions de ces dosages. Les dosages optimum peuvent varier en 
fonction de I'efficacite relative de chaque oligonucleotide ou ARNi, et peuvent en 
general etre estimes par la mesure des EC50 des doses utilisees in vitro et in vivo 
dans des modeles animaux. En general, le dosage est compris entre 0,01 ug et 
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100 g par kilo du poids corporel et peut etre administre une fois ou plus, de fagon 
journaliere, hebdomadaire, mensuelle ou annuelle, ou meme une fois toutes les 2 
a 20 annees. 

Des personnes competentes peuvent facilement determiner le taux de repetition 
5 des dosages base sur le temps de presence du compose dans les fluides 
corporels ou les tissus. Suite a un traitement reussit, il peut etre desirable que le 
patient continue une therapie de maintenance pour prevenir la reapparition de la 
maladie, pour ce faire I'oligonucleotide ou I'ARNi sont administres a des doses de 
maintenance allant de 0,01 pg a 100 g par kilo du poids corporel, une fois ou plus 
1 0 par jour jusqu'a une fois tous les 20 ans. 

L'administration d'antisens in vivo a ete realisee avec succes par divers auteurs, 
utilisant des protocoles d'injection simple d'antisens par voie intraveineuse (He et 
al. (1998) Zhonghua Shi Yan He Lin Chuang Bing Du Xue Za Zhi 12:1-4) ou 

15 intracerebral (Yoburn et al. (2003) Synapse 47: 109-1 16, Tischkau et'al. (2003) J. 
BioL Chem. 278: 718-723). Ces deux dernieres annees, des systemes plus 
complexes permettant le ciblage d'antisens dans Torganisme ont ete developpes 
et utilises avec succes (Morishita et al. (2002) J. Endocrinol. 175: 475-485, 
Bartsch et al. (2002) Pharm. Res. 19: 676-680), permettant chez la souris et le rat, 

20 de traiter divers cancers (Rait et al. (2002) Mol. Med. 8: 475-486, Ochietti et al. 
(2002) J. Drug. Target 10: 113-121, Eder et al. (2002) Cancer Gene Ther. 9:117- 
125). La transfection des antisens met en jeu les memes procedes que pour la 
transfection des ARNi, laissant envisager les memes applications in vivo pour les 
ARNi. Dans cette optique, nous pouvons imaginer un ciblage de I'antisens ou des 

25 ARNi au niveau du systeme nerveux central, pour traiter des troubles dont Porigine 
est centrale (obesite), mais aussi ceux obtenus par une action peripherique des 
recepteurs de la leptine. Plus particulierement, une action des antisens ou des 
ARNi au niveau du transport de la leptine au travers de la barriere henriato- 
encephalique et impliquant les OB-R peut etre envisagee. D'ailleurs, les cejlules 

30 endotheliales ont deja ete ciblees avec succes par une strategie antisens in>ivo 
(Bartsch et al. (2002) Pharm. Res. 19: 676-680). 

V 

Figures : 
Figure 1 

35 Sequences des differents ODN antisens utilises : 
Figure 2 

Alignement des sequences proteiques d'OB-RGRP de differentes especes et de la 
sequence proteique humaine de MY047. Les domaines transmembranaires 
potentiels ont ete determines par differentes methodes (HMMTOP, TMHMM, 
40 TopPred2, TMpred) et sont ecrites en gras. • ■ 

Figure 3 

Topologie d'OB-RGRP etudiee par BRET, par I'utilisation de la double proteine de 
fusion YFP-OB-RGRP-Luc. Figure 3a: representation schematique de la topologie 
d'OB-RGRP pour le modeles 3 et 4TM. Figure 3b : Resultats des experiences de 
45 BRET utilisant les proteines indiquees. Les donnees sont exprimees en mBU. 
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Figure 4 

Etude de roligomerisation d'OB-RGRP par des experiences de SDS-PAGE et 
immunoprecipitations. Figure 4a: Les cellules exprimant les proteines de fusion 
"indiquees ont ete traitees ou non avec du Dithiobis(succinimidyl propionate) (DSP) 

5 2 mmot.L-1 dans du PBS (1X pH7,4) pour cross-linker les complexes proteiques. 
Les proteines ont ete separees par SDS-PAGE et les proteines de fusions avec la 
YFP ont ete detectees par ('utilisation d'un anticorps specifique anti-YFP. Figure 
4b: Les cellules exprimant la construction 6Myc-OB-RGRP ont ete solubilisees 
avec 1% de digitonine ou 5% de SDS et le solubilisat a ete immunoprecipite avec 

10 * un anticorps anti-myc. Les precipitats ont ete soumis a une separation par SDS- 
, PAGE et les proteines etiquetees avec myc ont ete detectees avec un anticorps 
anti-myc. 

Figures 

Identification des determinants moleculaires impliques dans roligomerisation 
15 d'OB-RGRP. Les proteines de fusions avec les troncations d'OB-RGRP ont ete 
traitees comme decrit Fig. 4b. TM, domaine transmembranaire. 

Figure 6 

Etude de roligomerisation d'OB-RGRP dans les cellules HEK vivantes par la 
technologie de BRET. Figure 6a: Les proteines de fusion indiquees ont ete co- 
20 exprimees a un rapport equimolaire, et des experiences de mesures de BRET ont 
ete realisees. Figure 6b: Des quantites constantes du plasmide OB-RGRP-Luc ont 
ete co-exprimees avec des quantites croissantes du plasmide d'OB-RGRP-YFP et 
des mesures de BRET ont ete realisees. MT2R-Luc, proteine de fusion du 
recepteur MT2 de la melatonine avec la luciferase. 

25 Figure 7 

Interaction d'OB-R s et d'OB-RGRP etudiees par BRET. Les proteines de fusions 
indiquees ont ete co-exprimees a un rapport equimolaire et des mesures de BRET 
ont ete realisees. IR-YFP, proteine de fusion du recepteur de I'insuline avec la 
YFP. 

30 Figure 8 

Activation dose dependante des genes rapporteurs pour STAT3 (Figure 8a) et 
STATS (Figure 8b) dans des cellules HeLa, par OB-Ri en presence d'une sur- 
expression des constructions de la proteine OB-RGRP comme indiquees. 

Figure 9 

35 Effet de la surexpression d'OB-RGRP sur ['expression des OB-R a la surface des 
cellules. Des cellules HEK 293 transferees ou non avec le vecteur d'expression 
d'OB-RGRP, et des cellules COS transferees avec les vecteurs d'expression 

d'OB-Rj ou OB-Rs et +/- les vecteurs d'OB-RGRP, ont ete utilisees pour 
determiner la quantite de recepteurs exprimes a la surface et le total exprime dans 
40 les cellules par des experiences de liaison de 125 l-leptine. 

Figure 10 

Effet des differents oligodesoxynucleotides (ODN) antisens sur le niveau des 
messagers d'OB-RGRP observes par RT-PCR semi-quantitative. Figure 10a: 
determination de la zone lineaire d'amplification des transcrits d'OB-RGRP et de la 
45 GAPDH, en fonction du nombre de cycles PCR. Figure 10b: quantification des 
resultats montres dans le panneau a. Figure 10c: Determination des niveaux 
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d'expression relatifs des ARNm d'OB-RGRP a 26 cycles PCR, dans les cellules 
incubees avec les differents ODN antisens. 

Figure 11 

Effet des ODN antisens specifiques d'OB-RGRP sur I'activation d'un gene 
5 rapporteur STAT3. Les cellules HeLa ont ete co-transfectees premierement avec 
le vecteur d'expression OB-RI et les constructions des genes rapporteurs pour 
STAT3 ou 5, puis avec les ODN antisens indiques. Apres 48 heures de stimulation 
ou non avec 10 nmol.L-1 de leptine. > 

Figure 12 

10 Effet des ODN antisens specifiques d'OB-RGRP sur I'expression en surface des 
OB-R. Les cellules HeLa ont ete transferees ou non avec les plasmides 
d'expression d' OB-R| ou d'OB-R s avant une seconde transfection ou non avec les 
ODN antisens indiques. 48 h post-transfection, la quantite d'OB-R totale et la 
fraction exposee a la surface a ete determinee dans des experiences de liaison 

15 avec de la 125 l-leptine. 

La presente invention est illustree sans pour autant etre limitee par les exemples 
qui suivent. * 

20 Ma teriels et Methodes utilises dans les exemples 4 

Construction des plasmides. ,5: 

Les proteines de fusions des OB-R avec la YFP et la luciferase ont ete 
construites par ligation de la YFP et de la Luciferase a la partie C-terminale des 
recepteurs d'OB-R, par des techniques standards de biologie moleculaire. La 
25 region codante de la YFP a ete obtenue a partir du vecteur Cytogem®-Topaze 
(pGFPtpz-N1) (Packard, Meriden, CT) et fut inseree dans le site EcoRV Jdu 
vecteur pcDNA3/CMV (Invitrogen, Groningen, Pays-bas) contenant un polylinker 
modifie. La region codante de la Ren/7/a luciferase a ete obtenue a partir ^du 
vecteur pRL-CMV (Promega, Madison, Wl) et inseree dans le site EcoRV du 

30 vecteur pcDNA3 modifie. Les regions codantes d'OB-R| et d'OB-R s (gift of Dr. 
Gainsford, Royal Melbourne Hospital, Victoria, Australie) ont ete inseree dans les 
deux vecteurs decrits ci-dessus, respectivement dans les sites EcoR1/BamH1 et 
Nhe1. Les codons stop ont ete supprimes par mutagenese dirigee et la phase des 
proteines de fusion a ete ajustee en meme temps. 

35 Le vecteur pcDNA3-OB-RGRP a ete obtenu par insertion de la region 

codante d'OB-RGRP, obtenue depuis le vecteur pCDNA3-Di1, dans les sites 
EcoR1 et Xba1 du vecteur pcDNA3/CMV (Invitrogen, Groningen, Pays-bas). Le 
codon stop d'OB-RGRP a ete supprime par mutagenese dirigee. Le vecteur 
pcDNA3-OB-RGRP-Luc a ete. obtenu par digestion du vecteur pRL-CMV N3 

40 (Promega, Madison, Wl) avec Sma1 et Hpa1 et par insertion' du fragment, 
correspondant a la region codante de la Renilla luciferase, apres la region 
codante d'OB-RGRP dans le site BspE1 rempli du vecteur pcDNA3-OB-RGRP. 

Le vecteur pcDNA3-YFP a ete obtenu par sous-clonage de la region codante 
de la YFP a partir du vecteur pGFPtpz-N1 (Packard, Meriden, CT) insere dans le 

45 site EcoRV du vecteur pcDNA3/CMV. Le vecteur pcDNA3-OB-RGRP-YFP a ete 
obtenu par insertion du fragment BamH1/BspE1 du vecteur pCDNA3-OB-RGRP 
non-stop dans le vecteur pcDNA3-YFP digere avec les enzymes BamH1 et Age1. 
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La construction pcDNA3-GFP-OB-RGRP-Luc a ete obtenue par insertion du 
fragment OB-RGRP-Luc du vecteur pcDNA3-OB-RGRP-Rluc coupe par EcoR1, 
dans le site EcoR1 .du vecteur pcDNA3-YFP. Le codon stop de la YFP a ete 
elimine par mutagenese dirigee. 

5 Le vecteur 6Myc-OBR-GRP (4TM) a ete obtenu par insertion du fragment 

6myc du vecteur pCDNA3-RSV-6Myc, dans les sites BamH1 et EcoR1 du vecteur 
pCDNA3-OBRGRP. Les differentes deletions d'OB-RGRP (2 et 3 TM) ont ete 
obtenus par PCR et insertion dans le vecteur pcDNA3 dans les sites EcoR1 et 
Xba1. La sequence codante de MY047 a ete obtenue par RT-PCR sur des ARNm 

10 ^d'origine humaine. Le fragment PCR a ete digere par les enzymes de restriction 
EcoR1/Xba1 et insere dans le vecteur pcDNA3-Topaze coupe par les memes 
enzymes. Le codon stop de la YFP a ensuite ete elimine par mutagenese dirigee 
pour obtenir le vecteur pcDNA3-YFP-MY047. Le vecteur pcDNA3-MY047-GFP a 
ete obtenu par insertion du fragment d'ADN obtenu par PCR sur le vecteur 

15 pcDNA3-YFP-MY047 et coupe par BamH1, puis insere dans le vecteur pcDNA3- 
YFP coupe par la meme enzyme. L'insertion du meme fragment dans le vecteur 
pcDNA3-Rluc coupe par BamH1 a permit d'obtenir le vecteur pcDNA3-MY047- 
. Rluc. 

Toutes les constructions ont ete verifiees par sequengage. 



20 Culture cellulaire et transfection. 

Les cellules HEK 293, COS-7- et HeLa ont ete cultivees dans du DMEM 
supplements avec 10% (v/v) de SVF, 4,5 g/litre de glucose, 100 U/ml de 
penicilline, 0,1 mg/ml de streptomycine, 1 mmol.L-1 de glutamine (tous.de Life 
Technologies, Gaithersburg, MD). Les transfections transitoires ont ete realisees 
25 avec le reactif FuGene 6 (Roche, Basel, Suisse) selon les instructions du 
fournisseur. 



Preparation des membranes et solubilisation. 

Les membranes ont ete preparees comme decrit precedemment (19), et 
- resuspendues dans du Tris 75 mmol.L-1 (pH 7,4), du MgCl2 12,5 mmol.L-1, et 

30 EDTA 5 mmol.L-1 et immediatement utilisees dans des experiences de BRET. 



SDS PAGE et Western blot. 

Les lysats totaux ont etes prepares par lavage des cellules une fois au PBS 
froid (pH 7,4) et denatures par I'ajout de tampon de depot (30mmol.L-1 Tris HCI 

35 pH 6,8, 1% glycerol 5% SDS, 50 mmol.L-1 DTT et 0,05% bromophenol blue). Les 
lysats totaux ou les immunoprecipites ont ete incubes pendant 10 minutes a 90°C 
puis deposes sur gel d'acrylamide 10% pour une separation par electrophorese 
(SDS-PAGE). Les proteines ont alors ete transferees sur une membrane de 
nitrocellulose et revelees par des anticorps primaires specifiques : anti-YFP (8367- 

40 1 Living Colors) au 1/200eme, anti-myc A14 (sc-789 TEBU Peprotech Santa Cruz 
Biotechnology) au 1/500eme, puis un anticorps secondaire couple a la peroxydase 
(IgG de chevre anti-lapin ; Jackson Immunoresearch Laboratories, Inc., West 
Baltimore Pike) au 1/10000eme. Les bandes immuno-reactives ont ete revelees . 
par un kit ECL (Pharmacia Biotech). - 
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Immunoprecipitation. ^ 

Deux jours apres la transfection r les cellules ont ete lavees une fois au PBS 
froid, et les proteines ont ete extraites par une incubation pendant 15 minutes 

5 dans du tampon de lyse (PBS 1X, Nonidet P40 1%, Sodium Desoxycholate 0,5%, 
SDS 0,1%, NaN3 0,02%, benzamidine 10 mg.L-1 et des inhibiteurs de trypsine 5 
mg.L-1). Le lysat a ete centrifuge a 18000 g pendant 15 min et le surnageant a 
ensuite ete incube pendant 3 heures a 4°C avec un anticorps anti-myc couple a 
des billes d'agarose (sc-40AC TEBU preprotech, Santa CRUZ Biotechnology). Les 

10 precipites ont ete laves trois fois avec du tampon de lyse froid puis denatures avec 
du tampon de depot pour SDS-PAGE. / 

♦ 

Experiences de radioliaison. 

Les experiences de radioliaison ont ete realisees comme decrit 
precedemment (Barr et al.), avec de legeres modifications. Pour determiner ia 

15 liaison de la leptine en surface, les cellules cultivees en plaques 6 puits ont ete 
lavees deux fois au PBS froid et incubees dans le tampon de liaison (DMEM, 25 
mmol.L-1 Hepes pH 7,4, 1% BSA) contenant 100000 cpm/puit de 125 l-leptin 
(PerkinElmer life sciences, Paris, France) en presence ou non de 200 nmol.L-1 de 
leptine (PeproTech Inc, USA) pendant 4 h a 4°C. Les cellules ont ete lavees deux 

20 fois au PBS froid, puis lysees dans du NaOH 1N, et la radioactivite a ete 
determinee dans un compteur y. Pour determiner la liaison totale de la leptine, les 
cellules cultivees dans des boites de 10 cm de diametre ont ete solubilisees dans 
1,5 ml de tampon de liaison contenant 0,15% de digitonine pendant 2 h a 4°C. Les 
extraits ont ete centrifuges 30 min a vitesse maximale et a 4°C. Les surnageants 

25 (0,2ml) ont ete incubes avec 100000 cpm de 125 l-leptine en presence ou non de 
200 nmol.L-1 de leptine, dans un volume total de 0,25 ml en rotation constante-a 
4°C pendant une nuit. 0,5 ml de y-globuline (1 ,25 mg/ml) et 0,5 ml de polyethylene 
glycol 6000 (25% p/v) ont ete ajoutes pour precipiter les complexes recepteurs,- 
ligands, qui on ete centrifuges a 17000 g pendant 3 min. Le culot a ete lave une 

30 fois avec 1ml de polyethylene glycol 6000 (12 % p/v) et la radioactivite a ete 
determinee dans un compteur y. * 

Test d'activation des genes rapporteurs. 

Les cellules HeLa cultivees dans des puits de plaques 6 puits ont ete co- 
transfectees avec 500 ng d'un plasmide rapporteur exprimant la luciferase de 

35 firefly sous le controle d'elements de reponse pour les facteurs STAT3 ou STAT5, 
(gift of Dr. Levy, Universite de New York, New York, USA), 250 pg du vecteur 
d'expression pcDNA3-luciferase de Renilla (utilise comme standard interne entre 
les echantillons) et avec 500 ng des differents vecteurs d'expression des OB-R ou 
le vecteur seul. 48 h apres la transfection, les cellules ont ete mises a jeun 

40 pendant une nuit dans du milieu Otpimem (Invitrogen, Groningen, Pays-bas) 
contenant 1% de BSA, avant stimulation ou non par 10 nmol.L-1 de leptine 
pendant 48 h. Les cellules ont alors ete lavees une fois au PBS puis lysees dans 
du tampon de lyse passif (Promega Corporation, Madison, Wl) pendant 15 min a 
temperature ambiante. Les lysats totaux ont ete centrifuges pendant 2 min a 

45 15000 g et les surnageant ont ete utilisees dans un test de mesure de luciferase 
(Dual Luciferase Assay System de Promega Corporation, Madison, Wl) en 
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" utilisant un luminometre'Berthold (Lumat LB 9507)'. Les resultats sont exprimes en 
rapport des activites de la luciferase de firefly sur la luciferase de Renilla. 

Mesures de BRET en microplaques. 

48 h apres transfection, tes cellules COS-7, HeLa ou HEK 293 exprimant les 
5 proteines de fusions des OB-R ont ete detachees et lavees dans du PBS. 1-2x1 0 5 
cellules ont ete distributes dans des puits de plaques optiplate (96 puits, Packard 
Instrument Company, Meriden, CT) en presence ou non des ligands et incubees a 
25 °C. De fagon alternative, nous avons procede de la meme fagon avec des 
" membranes preparees a partir des cellules exprimant les differentes constructions. 
10 Le substrat, la Coelenterazine h (Molecular Probes, Eugene, OR) a ete ajoute a 
une concentration finale de 5 |amol.L-1 et les lectures ont ete realisees avec un 
lumino/fluorimetre Fusion™ (Packard Instrument Company, Meriden, CT) qui 
permet la mesure de la luminescence a travers deux filtres (filtre Luciferase: 485 ± 
10 nm; filtre YFP: 530 ± 12.5 nm). Le rapport de BRET a ete defini comme la 
15 difference d'emission a 530 nm/485 nm des cellules co-transfectees avec les 
proteines de fusion Luc et YFP et remission a 530 nm/485 nm de la proteine de 
fusion Luc transfectee seule dans les cellules. Les resultats sont exprimes en 
unites de milliBRET (mBU), 1 mBRET correspond aux valeurs des differences des 
ratios multiplies par 1000. 

20 RT-PCR. 

Les ARN totaux ont ete extraits par la methode de Chomczynski et Sacchi 
(Chomcynzki P., et Sacchi N. (1987) Anal. Biochem. 162, 156-159). 1 P9 d'ARN 
est denature pendant 5 minutes a 68°C puis refroidit brutalement pendant 5 min a 
4°C. L'echantillon denature est reverse-transcrit pendant 1 h a 37°C dans 20 pi de 

25 milieu reactionnel RT (5pmol.L-1 PdN6, 10pmol.L-1 DTT, 50mmol.L-1 Tris-HCI 
pH-8,3, 75mmol.L-1 KCI, 5mmol.L-1 MgCI2, 500 pmol.L-1 dNTP, 200U RT- 
MMLV). Un aliquote de 2,5 pi de cette reaction est utilise pour une reaction de 
PCR dans un volume final de 25pl (40mmol.L-1 Tris-HCI pH 8,4; 100 mmol.L-1 
KCI; 1,5 mmol.L-1 MgCI2; 0,2mmol.L-1 de chaque dNTP; 0,141mmol.L-1 

30 d'amorces specifiques d'OB-RGRP (Sens: CCGTGGCAGGAAGC, antisens: 
CAGCCACACGAGCAAG) et 0,035mmol.L-1 d'amorces specifiques de la 
glyceraldehyde phosphate dehydrogenase (GAPDH) (sens: 

GGAGAAGGCTGGGGC, antisens: G ATGGCATG G ACTGTGG ) et 2,5U de TAQ DNA 

polymerase). Le protocole suivant a ete utilise pour la reaction de PCR : 
35 Denaturation initiale de 3 min a 94°C, puis 22 a 30 cycles de denaturation (20 sec 

a 94°C), hybridation (20 sec a 59°C), elongation (20 sec a 72°C) suivie par une 

elongation finale de 7 min a 72°C. 

Uri aliquote de la reaction de PCR est depose sur un gel d'agarose a 2% 

pour separer les produits de la reaction par electrophorese. Les tailles attendues 
40 des fragments de la GAPDH et d'OBR-GRP sont respectivement de 229 pb et 334 

pb. . 

Synthese cToIigonucleotides 
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Les oligonucleotides ont ete synthetises sur synthetiseur automatique d'ADN 
(modele 8909 "Expedite MOSS" d'Applied Biosystems) par chimie standard de 
phosphoramidites et oxydation a Node. La demethylation a ete effectuee par une 
solution a 0,2 mol.L-1de 3H-1 ,2-benzodithiole-3-one 1,1-dioxide dans I'acetonitrile 
5 pendant 120 s. Le detachement du support et la deprotection ont ete realises en 
ammoniac concentre (18 h a 55°C), puis les oligonucleotides ont etes purifies par 
precipitation. Le produit de deprotection a ete precipite par 10 volumes de 1- 
butanol; le culot repris dans un volume de NaCI a 0,3 moLL-1a ete reprecipite par 
I'addition de 4 volumes d'ethanol. 

10 L'analyse par gel de polyacrylarnide a 20% (en tampon uree 8 mol.L-1-et Tris- 
borate 454 mmol.L-1 a pH 7,0) a montre une proportion superieure .a 80% de 
produit de longueur attendue. 

Transfection des OligoDesoxyNucleotides antisens. 

Pour la transfection de 300 000 cellules cultivees dans un puit de plaque 6 
15 puits, 10 pL d'ODN antisens a 20 pmol.L-1 ont ete dilues dans 175 pL de DMEM. 
3 pL d'oligofectamine (Invitrogen, Groningen, Pays-bas) et 12 pL de DMEM ont 
ete incubes dans un second tube pendant 10 min a temperature ambiante. Le 
melange oligofectamine / DMEM est alors ajoute a I'ODN antisens dilue, vortexe 
et incube 20 min a temperature ambiante. Pendant ce temps, les cellules sont 
20 lavees une fois au PBS, une fois au DMEM, puis recouvertes de 800 pi de DMEM. 
Le melange ODN / oligofectamine a alors ete ajoute goutte a goutte sur les 
cellules et incube 4h a 37°C avant I'ajout de 500 pi de DMEM supplements avec : 
30% de serum. 

X 

Exemple 1 : Topologie et localisation cellulaire d'OB-RGRP. ' ~ I 

*S < • 

25 Pour etudier la topologie et la localisation subcellulaire d^B-RGRP, nous 

avons etiquete la proteine avec le variant jaune de la Green Fluorescent Protline 
(YFP) a rextremite de sa queue C-terminale. La proteine de fusion a ete exprimee 
dans les cellules HeLa et sa localisation a ete determinee par microscopie de 
fluorescence. 

30 Les resultats montrent que la proteine de fusion est ciblee preferentiellement 

au niveau des membranes perinucleaires et dans des vesicules intracellulaires. 
Des resultats similaires ont ete observes dans les cellules HEK. Aucune co- 
localisation avec des proteines cytoplasmique et nucleaires n'ont ete observees, 
confirmant la localisation d'OB-RGRP au niveau de membranes (non montre). La 

35 nature exacte du compartiment membranaire a ete determine par des etudes de 
co-localisation avec des marqueurs specifiques de compartiment subcellulars. 
Une forte co-localisation a ete observee avec la chaTne invariahte des proteines 
de classe II du CMH, un marqueurdu compartiment endocytique. 

L'analyse initiale de la topologie d'OB-RGRP suggerait une organisation en 3 

40 domaines transmembranaires (TM) (14). Une organisation similaire a ete 
proposee pour MY047 (16). Cependant, une nouvelle analyse du profil 
d'hydrophobicite des differentes sequences proteiques disponibles pour OB- 
RGRP et MY047 est aussi compatible avec un modele a 4 TM (Fig. 2). La 
topologie differe profondement entre ces deux modeles. Dans le modele a 3 TM, 

45 les extremites N- et C-terminales sont localisees de chaque cote de la membrane, 
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alors que dans le modele a 4 TM, les deux queues sont orientees du meme cote 
de la membrane (Fig. 3a). Pour determiner le bon modele; nous avons utilise la 
methode de transfert d'energie par resonance (BRET), qui a recemment ete 
developpee pour suivre les interactions proteine-proteine dans les cellules 
vivantes(Xu et al. (1999) Proc Natl Acad Sci U S A 96, 151-156) . Dans le cas 
d'une proximite physique (< 100' A) entre les deux proteines interagissant, un 
transfert d'energie peut avoir lieu -entre le donneur d'energie (Luc) et I'accepteur 
d'energie (YFP), fusionnes aux deux proteines d'interet. Nous avons etiquete la 
queue N-terminale d'OB-RGRP avec la YFP, la queue C-terminale avec la 
luciferase, et nous avons observe le transfert d'energie par des mesures de BRET 
avec cette double proteine de fusion. Le modele a 3 TM ne permet pas de 
transfert puisque les deux partenaires de BRET sont separes par la bicouche 
lipidique. Le modele a 4 TM au contraire prevoit un fort transfert d'energie puisque 
les' deux partenaires sont localises du meme cote de la membrane. Comme 
montre dans la figure 3b, un tres fort transfert d'energie a ete detecte pour la 
double proteine de fusion dans les cellules intactes, indiquant qu'OB-RGRP 
possede4TM. 

L'ensemble de ces resultats suggere qu'OB-RGRP est une proteine 
membranaire a 4 domaines transmembranaires, possedant 3 courtes boucles et 
des extremites N- et C-terminales courtes orientees du meme cote de la 
membrane. OB-RGRP est majoritairement localisee dans des compartiments 
intracellulaires. 

Exemole 2: Oliqomerisation d'OB-RGRP. 

ft 

L'oligomerisation est une propriete commune a differentes proteines y 
compris des proteines membranaires comme les recepteurs tyrosine kinase, les 
recepteurs aux cytokines et les phosphotyrosines phosphatase. II a ete montre 
que cette oligomerisation joue un role important dans la fonction de ces proteines. 
Pour obtenir des elements dans la fonction d'OB-RGRP, nous avons voulu savoir 

si cette. proteine oligomerise. 

OB-RGRP a ete etiquetee avec la YFP a sa queue C-terminale et exprimee 
dans des cellules HeLa. Les proteines ont ete separees par electrophorese sur gel 
de polyacrylamide en condition denaturante (PAGE-SDS) et des experiences 
d'immunoblot ont ete realisees avec un anticorps anti-YFP. La figure. 4a revele 
plusieurs bandes specifiques d'OB-RGRP-YFP, correspondent a des formes 
monomeriques, dimeriques et des complexes oligomeriques. Des resultats 
similaires ont ete obtenus avec OB-RGRP etiquetee en N-terminal soit avec la 
YFP ou un epitope myc (Fig. 4 a,b). La formation des oligomeres d'OB-RGRP a 
ete observee sur des extraits cellulaires totaux apres immunoprecipitaion. 
^utilisation d'un cross-linker sur les cellules entieres, stabilise les complexes 
dimeriques, indiquant que la forme dimerique est la forme predominate d'OB- 
RGRP dans les cellules intactes (Fig. 4a). 

De fagon surprenante, OB-RGRP a des proprietes inattendues puisque les 
oligomeres sont stables en presence de differents agents denaturant et/ou 
dissociant comme le SDS 5%, le Triton X-100 1%, le Nonidet P40 1%, la 
digitonin1%, le DTT 50 mmol.L" 1 et le p-mercaptoethanol 2%. Cependant, des 
observations similaires ont ete obtenues pour d'autres proteines membranaires 
comme la glycophorine A et les recepteurs p2-adrenergiques couples aux 
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proteines G. Des etudes sur ces proteines montrent respectivement que des 
motifs LIXXGVXXG et LXXXGXXXGXXXL dans les domaines transmembranaires 
sont essentiels pour la formation des oligomeres. Des motifs similaire ont ete 
identifies dans les regions membranaires d'OB-RGRP. 

5 Pour identifier les determinants moleculaires impliques dans la dimerisation, 

nous avons realise des constructions d'OB-RGRP presentant des deletions 
progressives de la queue C-terminale (Fig. 5). Une construction contenant les 
deux premiers TM potentiels perd la capacite de former des oligomeres. L'addition 
du 3 6me TM restaure la possibility de former des dimeres. Cependant, le profil 

10 complet d'oligomerisation a seulement ete observe en presence des .4 TM 
potentiels. 

Les oligomeres de proteines membranaires peuvent etre des artefacts induit 
durant la preparation des echantillons (solubilisation, denaturation etc.)., C'est 
pourquoi il est important de verifier roligomerisation des proteines dans des 

15 cellules vivantes. Les techniques de transfer! d'energie developpees recemment 
comme le BRET permettent de suivre de telles interactions proteines-proteines 
dans les cellules vivantes. Des proteines de fusions d'OB-RGRP avec la luciferase 
et la YFP ont ete utilisees pour suivre roligomerisation d'OB-RGRP dans les 
cellules vivantes. La co-expression des constructions OB-RGRP-YFP ou YFP-OB- 

20 RGRP avec la construction OB-RGRP-Luc induit un transfert d'energie (Fig. 6a). 
La specificite de cette interaction a ete montree par I'absence de transfert 
d'energie lors de la co-expression avec deux proteines de fusions d iffe rentes ,: la 
parrestine2-YFP(Angers et al. (2000) Proc Natl Acad Sci U S A 97, 3684-3689) , 
ou le recepteur MT2 de la melatonine-Luc(Ayoub et al. (2002) J Biol Chem 277, 

25 21522-21528) . Nous avons alors exprimes differents rapports des partenaires de 
BRET (Fig. 6b). Le signal de BRET est augmente de fagon hyperbolique* en 
fonction du ratio OB-RGRP-YFP / OB-RGRP-Luc, atteignant une asymptoteiqui 
correspond a la saturation des molecules donneurs d'energie (OB-RGRP-Luc)tpar 
les molecules accepteurs (OB-RGRP-YFP), ce qui est attendu dans le cas djune 

30 interaction specifique. 

Collectivement, ces resultats montrent qu'OB-RGRP est une proteine 
membranaire dirnerique qui peut aussi etre engagees dans des complexes 
oligomeriques de plus haut poids moleculaire. Les 3eme et 4eme domaines 
transmembranaires potentiels semblent etre important pour la formation des 

35 oligomeres. 

Exemple 3: interaction entre les OB-R et OB-RGRP. 

Nous avons utilise la technologie de BRET pour etudier une possible 
interaction entre les OB-R et OB-RGRP dans les cellules vivantes. Un transfert 

40 d'energie a ete observe de fagon constitutive dans les cellules co-exprimant la 
construction OB-R s -Luc et la construction OB-RGRP-YFP indiquant une proximite 
des partenaires d'interaction (Fig. 7). Les memes resultats ont ete obtenus dans 
des cellules co-exprimant OB-R s -Luc et la construction MY047-YFP, ainsi que 
dans Torientation inverse : dans des cellules co-exprimant OB-RGRP-Luc et OB- 

45 R S -YFP, ou dans des cellules co-exprimant MY047-Luc et OB-R s -YFP. La 
specificite de ces interactions a ete confirmee par I'absence de transfert d'energie 
entre OB-R s -Luc, OB-RGRP-Luc, MY047-Luc et une construction du recepteur de 
I'insuline etiquete avec la YFP(Boute et al. (2001) Mol Pharmacol 60, 640-645) , 
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ainsi que dans I'orientation inverse : par I'absence de transfert d'energie entre une 
construction du recepteur de I'insuline etiquete aveo la Luc et les constructions 
OB-Rs-YFP, OB-RGRP-YFP et MY047-YFP. La co-expression d'OB-R s -Luc et 
*' une construction d'OB-RGRP ou de MY047 presentant I'etiquette YFP en N- 
5 terminal ne provoque pas de signal significatif, confirmant la specificite de 
"■■ interaction avec OB-RGRP-YFP et MY047 et indique que I'extremite N-terminale 
d'OB-RGRP et MY047 doit etre impliquee dans I'interaction avec OB-R. 

Aucun transfert d'energie significatif n'a ete observe dans les cellules co- 

* exprimant les constructions OB-R|-Luc et OB-RGRP-YFP ou YFP-OB-RGRP. Ceci 
10 n'est pas du a une absence d'expression fonctionnelle OB-R|-Luc puisqu'un signal 

de BRET specifique a ete observe dans des cellules co-exprimant OB-R|-YFP 
pour suivre la dimerisation des OB-R. L'absence de BRET entre les proteines de 
fusions OB-Ri-Luc et OB-RGRP-YFP n'exclue pas une interaction directe entre 
ces deux proteines puisque cela peut etre explique par le fait que la distance entre 
15 les deux partenaires de BRET (Luc et YFP) soit plus importante que 100 A, la 
distance maximale permettant d'obtenir un transfert. Cela doit etre le cas puisque 
les extremites N- et C-terminales d'OB-RGRP doivent etre localisees proche de la 

region transmembranaire des OB-R, alors que I'extremite C-terminale d'OB-R| doit 
plus probablement pointer vers le cytoplasme a cause de sa longue queue 
20 intracellular d'environ 300 acides amines. Etant donne que les isoformes courte 
et longue des OB-R partagent les memes regions trans- et juxta-membranaire et 
que interaction d'OB-RGRP avec OB-R s est localisee a ce niveau, il est probable 

qu'OB-RGRP interagisse avec OB-R| de la meme maniere qu'avec OB-R s . 

25 Exemple 4: Effet de la surexpression d'OB-RGRP sur la signalisation des OB- 
R. 

Des constructions contenant des elements de reponse pour STAT3- ou 
STAT5-en amont d'un gene reporter luciferase ont ete co-exprimees avec OB-R| 
en absence ou en presence de differentes constructions d'OB-RGRP (Fig. 8). Les 

30 deux constructions ont ete activees par la leptine de fagon dose dependante avec 
un EC50 d'environ 50 pM. Des resultats similaires ont ete obtenus dans des 
cellules HEK 293 exprimant de fagon stable un gene rapporteur pour STAT3. La 
surexpression de differentes constructions d'OB-RGRP n'a pas eu d'effet 
reproductible sur cette activation indiquant qu'OB-RGRP n'est pas un facteur 

35 limitant. 

Exemple 5: Effet de la surexpression d'OB-RGRP sur Texpression des OB-R 
a la surface. 

Dans des levures knock-out pour OB-RGRP (Vps55), le transport de 
40 proteines est perturbe entre le golgi et les vacuoles (Belgareh-Touze et al. (2002) 
Molecular Biology Of The Cell 13, 1694-1708) . Bien que les OB-R soit actives 
uniquement lorsqu'ils sont exprimes a la membrane plasmique, une quantite 
importante de recepteurs est accumulee dans des compartiments intracellulaires 
(Barr, et al. (1999) J Biol Chem, 274, 21416-21424)(Lundin et al. (2000) 
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Biochimica et Biophysica Acta 1499, 130-138) . C'est pourquoi nous avons teste 
les effets de la surexpression d'OB-RGRP sur Texpression des OB-R a la surface 
des cellules. ' I , 

La repartition des recepteurs a ete etudiee par des experiences de liaison de 
5 125 I-leptine. En accord avec d'autres auteurs (Barr et al. 1999), nous avons montre 

que seulement 10-20 % des recepteurs OB-R| et OB-R s sont exprimes a la 
surface de cellules COS transferees (Fig. 9) et des cellules HeLa. Ce n'est pas 
un artefact due a ('expression de recepteurs exogenes car des valeurs similaires 
sont obtenues dans des cellules HEK 293 exprimant des recepteurs endogenes 
10 OB-R (Fig. 9). La surexpression d'OB-RGRP n'a pas montre de modification de la 
quantite totale dans les cellules, et le % de recepteurs exprimes a la surface (Fig. 

9). ( 

Exemple 6: Caracterisation de desoxynucleotides antisens specifiques d'OB- 
15 RGRP 



OB-RGRP semble avoir une expression ubiquitaire, c'est pourquoi la 
diminution de I'expression de cette proteine a ete choisie comme approche 
alternative pour etudier son role dans la fonction des OB-R. Quatorze antisens 
specifiques pour OB-RGRP (AS 1 a 14) et deux antisens aleatoires (AS 15 et 16) 

20 ont ete choisis (voir Figure 1), synthetises puis testes pour leur capacite a inhiber 
('expression d'OB-RGRP par des experiences de RT-PCR semi-quantitative dans 
les cellules HeLa exprimant OB-RGRP de fagon endogene (Fig. 10). Seul un.de 
ces antisens (AS-14), derive de la region 3' non traduite de I'ARNm d'OB-RGRP 
interfere avec I'expression d'OB-RGRP. Le marquage de cet antisens avec le 

25 fluorophore Cy3 a permit de montrer que Tensemble des cellules etait transfecte 
avec nos conditions experimentales, lors de nos differentes experiences. 1 

Exemple 7: Effet de Tantisens specifique d'OB-RGRP sur la signalisation et 
rexpression en surface des OB-R, 

30 Les cellules HeLa ont d'abord ete co-transfectees avec les vecteurs 

d'expression d'OB-R| et le gene rapporteur pour STAT3 puis avec les antisens. La 
leptine provoque une augmentation de Tactivation basale du gene rapporteur pour 
STAT 3 d'environ 1 ,5 fois dans les cellules centrales sans antisens, ou avec un 
antisens controle (AS16) (Fig. 11). Dans les cellules transferees avec Pantisens 

35 specifique pour OB-RGRP (AS-14), la signalisation basale et stimulee par la 
leptine est relativement augmentee par rapport aux conditions centrales. Ceci 
montre que I'activation de la voie JAK/STAT est augmentee dans les cellules 
presentant une diminution de I'expression d'OB-RGRP. Ces observations peuvent 
etre expliquees par un effet inhibiteur d'OB-RGRP sur I'activite basale et stimulee 

40 des OB-R, et dans ce cas, OB-RGRP peut etre consideree comme un regulateur 
de la signalisation des OB-R. Une autre alternative est qu'OB-RGRP pourrait 
reguler i'expression des recepteurs en surface en limitant le nombre des OB-R 
atteignant la surface des cellules. Ceci est en accord avec le fait que seulement 
10 a 20 % des recepteurs exprimes atteignent la surface cellulaire. Dans cette 

45 hypothese, la diminution de I'expression d'OB-RGRP devrait augmenter le nombre 
de recepteurs a la surface des cellules, ce qui devrait augmenter la signalisation 
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par ces recepteurs. Pour tester cette hypothese, nous avons quantifie le nombre 

de recepteurs OB-R| et OB-R s exprimes a la surface des cellules en presence 
(controle) et en absence (AS-14) d'OB-RGRP (Fig. 12). La transfection de 
I'antisens aleatoire n'a pas rnontre d'effet sur le. nombre de recepteurs exprimes a 
la surface des cellules, alors que celle de I'antisens specifique (AS-14) a provoque 
une augmentation de 3 fois du nombre des OB-R exprimes a la membrane 
plasmique. Des resultats similaires ont ete obtenus dans des cellules HeLa non 
transferees exprimant des recepteurs endogenes. Dans ces conditions 
experimentales, le nombre total de recepteurs, rnesure par des experiences de 
liaison de 125 l-leptine, n'a pas montre de variations significatives. 

L'ensemble de nos resultats est consistant avec le role d'OB-RGRP chez la 
levure, dans le transport des proteines. L'augmentation de ('expression en surface 
des OB-R semble impliquee dans ['augmentation de la signalisation observee. 
Cependant, nous ne pouvons pas totalement exclure I'hypothese qu'OB-RGRP 
regule directement I'activite des OB-R. L'application d'antisens specifiques diriges 
contre OB-RGRP devrait etre utile pour augmenter la signalisation des OB-R dans 
les desordres associes a la leptine, comme I'obesite humaine ou Ton observe une 
resistance a la leptine, caracterisee par une reponse inadaptee a cette hormone. 
L'augmentation de Texpression des recepteurs a la surface des cellules et de leur 
signalisation doit etre importante pour augmenter la reponse a la leptine dans le 
cas de I'obesite humaine, premierement par augmentation du transport de la 
leptine vers le cerveau a travers la barriere hemato-encephalique et 
deuxiemement par une augmentation de la signalisation des OB-R au niveau de 
Thypothalamus. 

L'interaction entre OB-RGRP et OB-R s laisse supposer que I'action d'OB- 
RGRP se fait par cette interaction directe avec les recepteurs et qu'empecher 
celle-ci peut conduire a reproduire les effets de I'ODN antisens specifique. Nous 
proposons d'utiliser le test de BRET des interactions entre OB-RGRP et OB-R Sl et 
MY047 et OB-R s decrit plus haut, comme test de criblage de molecules pouvant 
moduler cette interaction. Ce test pourra etre realise soit sur des cellules entieres 
ou permeabilisees, co-exprimant les proteines de fusions des partenaires de 
- BRET d OB-RGRP et d'OB-R s ou de MY047 et d' OB-R S) soit sur des fractions 
membranaires issues de ces cellules. 
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REVENDICATIONS 



1. Oligonucleotide eventuellement modifie comprenant de 8 a 50 
nucleotides qui hybride de maniere specifique a la sequence SEQ ID 

1 et inhibe I'expression de OB-RGRP. 

2. Oligonucleotide selon la revendication 1 caracterise en ce qu'il favorise 
('expression des rece'pteurs de la leptine a la surface cellulaire. 

3. Oligonucleotide selon I'une des revendi cations 1 et 2 caracterise en ce 
qu'il est un antisens. 

4 Oligonucleotide selon I'une des revendications 1 a 3 caracterise en ce 
qu'il comprend une sequence presentant une identite d'au mOins 60% 
avec la sequence SEQ ID N° 2. 

5. Oligonucleotide selon I'une des revendications 1 a 3 caracterise en ce 
que des nucleotides sont thioesterifies. 

6. Oligonucleotide selon I'une des revendications 1 a 3 caracterise en-ce 
que des nucleotides sont 2' O-methyles. 



7. Oligonucleotide selon I'une des revendications 1 a 3 caracterise en?te 
qu'il presente un residu triethyleneglycol a son extremite 3'. 

8. Oligonucleotide selon I'une des revendications 1 a 3 caracterise erijce 
qu'il est simple brin. *~ 

9. Oligonucleotide selon I'une des revendications 1 a 8 caracterise en* ce 
qu'il comprend une sequence presentant une identite d'au moins 60% 
avec la sequence SEQ ID N°2, dans laquelle les nucleotides en 
positions 2, 4, 6, 7, 9, 11, 13, 15, 17, 19 et 20, dans le sens 5' vers 3', 
sont thioesterifies. 

10. Oligonucleotide selon I'une des revendications 1 a 8 caracterise en ce 
qu'il comprend une sequence presentant une identite d'au moins 60% 
avec la sequence SEQ ID N°2, dans laquelle les nucleotides en 
positions 1, 2, 3, 4, 5, 16, 17, 18, 19 et 20, dans le sens 5' vers 3', sont 
2' O-methyles. 

11. Oligonucleotide selon I'une des revendications 1 a 10 caracterise en ce 
qu'il est un ADN. 

^.Oligonucleotide de type ARNi comprenant de 15 a 25 nucleotides 
caracterise en ce qu'il hybride de maniere specifique a la sequence 
SEQ ID N° 21 et inhibe I'expression de OB-RGRP. 
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REVENDICATIONS 



1. Oligonucleotide eventuellement modifie comprehant de 8 a. 50 nucleotides qui 
hybride de maniere specifique a la sequence SEQ ID N° 1 et inhibe l'expression de 
OB-RGRP. 

2. Oligonucleotide selon la revendi cation 1. caracterise en ce qu'il favorise 
T expression des recepteurs de la leptine a la surface cellulaire. 

3. Oligonucleotide selon Tune des revendications 1 et 2 caracterise en ce qu'il est un 
antisens. 

4. Oligonucleotide selon Tune des revendications 1 a 3 caracterise en ce qu'il 
comprend une sequence presentant une identite d'au moins 60% avec la sequence 

. SEQ IDN°2. 

5. Oligonucleotide selon Tune des revendications 1 a 3 caracterise en ce que des 
nucleotides sont thioesterifies. 

6. Oligonucleotide selon Tune des revendications 1 a 3 caracterise en ce que des 
nucleotides sont 2' O-methyles. 

7. Oligonucleotide selon l'une des revendications 1 a 3 caracterise en ce qu'il 
presente un residu tri&hyleneglycol a son extremite 3 \ 

8. Oligonucleotide selon Tune des revendications 1 a 3 caracterise en ce qu'il est 
simple brin. 

9. Oligonucleotide selon Tune des revendications 1 a 8 caracterise en ce qu'il 
comprend une sequence presentant une identite d'au moins 60% avec la sequence 

. SEQ ID N°2, dans laquelle les nucleotides en positions 2, 4, 6 5 7, 9, 1 1, 13, 15, 1 1, 
19 et 20, dans le sens 5' vers 3', sont thioesterifies. 

10. Oligonucleotide selon l'une des revendications 1 a 8 caracterise en ce qu'il 
comprend une sequence presentant une identite d'au moins 60% avec la sequence 
SEQ ID N°2, dans laquelle les nucleotides en positions 1, 2, 3, 4, 5, 16, 17, 18, 19 
et 20, dans le sens 5' vers 3', sont 2' O-methyles. 

11. Oligonucleotide selon l'une des revendications 1 a 10 caracterise en ce qu'il est un 
ADN. 

12. Oligonucleotide de type ARNi comprenant de 15 a 25 nucleotides caracterise en ce 
qu'il hybride de maniere specifique a la sequence SEQ ID N° 21 et inhibe 
l'expression de OB-RGRP. 

13. Oligonucleotide selon la revendication 12 caracterise en ce qu'il est un ARM 
double brin. 
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13. Oligonucleotide selon la revendication 12 caracterise en ce qu'il est un 
ARN double brin. 

14. Vecteur exprimant un oligonucleotide selon I'une des revendications 1 a 
4et 12. 

15. Cellule contenant un vecteur selon Jlune des revendications 13 ef 14. 

16. Medicament contenant un oligonucleotide, uri vecteur ou une cellule 
selon I'une des revendications 1 a 15. 

17. Composition pharmaceutique contenant un quantite 
pharmacologiquement active d'un oligonucleotide, d'un vecteur ou d'une 
cellule selon I'une des revendications 1 a 15 et des excipients 
pharmaceutiqUement acceptables. 

18. Utilisation d'un oligonucleotide, d'un vecteur ou d'une cellule selon I'une 
des revendications 1 a 15 pour la fabrication d'un medicament pour la 
prevention et / ou le traitement de pathologies liees a la leptine. 

19. Proteine de fusion caracterisee en ce qu'elle est composee d'une 
sequence presentant une identite d'au moins 65% avec la sequence 
SEQ ID N°4 ou avec la sequence SEQ ID N°16, ou d'une p'artie 
substantielle de la sequence SEQ ID N°4 ou de la sequence SEQ; ID 
N°16, et d'une proteine donneur d'energie ou accepteur d'energie.'fou 
d'une partie substantielle et active d'une proteine donneur d'energie ou 
accepteur d'energie. . 

A * \ V 

20. Proteine de fusion selon la revendication 19 caracterisee en ce que la 

proteine est une luciferase. - 

... 

21. Proteine de fusion selon la revendication 19 caracterisee en ce que la 
proteine est la GFP ou un mutant de cette proteine ou la DsRed . 

22. Proteine de fusion selon la revendication 19 caracterisee en ce que le 
mutant de la GFP est la YFP, I'EYFP, la GFP sauvage, la GFPS65T, ou 
la Topaz. 

23 Proteine de fusion selon la revendication 19 caracterisee en ce qu'elle 
presente la sequence SEQID N°6, SEQ ID N°8, SEQID N°18 ou SEQID 
N°20. 

24. Acide nucleique codant pour I'une des proteines selon I'une des 
revendications 19 a 23. 

25. Acide nucleique selon la revendication 24 caracterise en ce qu'il 
presente la sequence SEQID N°5, SEQID N°7, SEQID N°17 ou SEQID 
N°19. 
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14. Vecteur exprimant un oligonucleotide selon l'une des revendications 1 a 4 et 12. 

1 5. Cellule contenant un vecteur selon la revendication 14. 

16. Medicament contenant un oligonucleotide, un vecteur ou une cellule selon Tune 
des revendications 1 a 15. 

17. Composition pharmaceutique contenant un quantite pharmacologiquement active 
d'un oligonucleotide, d'un vecteur ou d'une cellule selon Tune des revendications 
1 a 15 et des excipients pharmaceutiquement acceptables. 

18. Utilisation d'un oligonucleotide, d'un vecteur ou d'une cellule selon Tune des 
revendications 1 a 15 pour la fabrication d'un medicament pour la prevention et / 
ou le traitement de pathologies liees a la leptine. 

19. Proteine de fusion caracterisee en ce qu'elle est composee d'une sequence 
presentant une identite d'au moins 65% avec la sequence SEQ ID N°4 ou avec la 
sequence SEQ ID N°16, ou d'une partie substantielle de la sequence SEQ ID N°4 
ou de la sequence SEQ ID N°16, et d'une proteine donneur d'energie ou 
accepteur d'energie, ou d'une partie substantielle et active d'une proteine donneur 
d'energie ou accepteur d'energie. 

20. Proteine de fusion selon la revendication 1 9 caracterisee en ce que la proteine est 
une luciferase. 

21. Proteine de fusion selon la revendication 19 caracterisee en ce que la proteine est 
la GFP ou un mutant de cette proteine ou la DsRed . 

22. Proteine de fusion selon la revendication 21 caracterisee en ce que le mutant de la 
GFP est la YFP, l'EYFP, la GFP sauvage, la GFPS65T, ou la Topaz. 

23. Proteine de fusion selon la revendication 19 caracterisee en ce qu'elle presente la 
sequence SEQID N°6, SEQID N°8, SEQID N°18 ou SEQID N°20. 

24. Acide nucleique codant pour l'une des proteines selon Tune des revendications 19 
a 23. 

25. Acide nucleique selon la revendication 24 caracterise en ce qu'il presente la 
sequence SEQID N°5, SEQID N°7, SEQID N°l 7 ou SEQID N°19. 



26. Acide nucleique presentant une identite d'au moins 65% avec la sequence selon la 
revendication 25. 

27. Acide . nucleique hybridant dans des conditions de forte stringence avec la 
sequence selon la revendication 25. 

28. Cellule comprenant un acide nucleique selon l'une des revendications 24 a 27. 

29. Cellule exprimant une proteine selon Tune des revendications 19 a 23. 
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26. Acide nucleique presentant une identite d'au moins 65% avec la 
sequence selon la revendication 25. 

27. Acide nucleique hybridant dans des conditions de forte stringence avec 
la sequence selon la revendication 25. 

28. Cellule comprenant un acide nucleique selon I'une des revendications 

24 a 27. : ;." 

♦ 

29. Cellule exprimant une proteine selon I'une des revendications 19 a 23. 

30. Fragments de cellules selon I'une des revendications 28 et 29. - 

31 . Lysat de cellules selon I'une des revendications 28 et 29. 

32. Membranes de cellules selon I'une des revendications28 et 29. 

33. Procede de determination de la modification de interaction entre une 
proteine presentant une identite d'au moins 65% avec la sequence 
SEQ ID N°4 ou la sequence SEQ ID N°16, et le recepteur de la leptine 
par un compose comprenant les etapes consistant a : 

-mettre en contact ledit compose avec une proteine presentant une identite 
d'au moins 65% avec la sequence SEQ ID N°4 ou la sequence SEQ ID N°16, 
et le recepteur de la leptine, ou des cellules, ou des fragments, ou des lysats, 
ou des membranes de cellules comprenant de telles proteines, ^et 
eventuellement un substrat enzymatique adequat, et 

-a mesurer I'interaction entre la proteine presentant une identite d'au moins 
65% avec la sequence SEQ ID N°4 ou la sequence SEQ ID N°16, eBe 
recepteur de la leptine. 

34. Precede de determination de la modification de I'interaction entre une 
proteine presentant une identite d'au moins 65% avec la sequence 
SEQ ID N°4 ou la sequence SEQ ID N°16, et le recepteur de la leptine 
par un compose comprenant les etapes consistant a : 

-mettre en contact ledit compose avec une proteine de fusion donneur 
d'energie, et une proteine de fusion accepteur d'energie, ou des cellules, ou 
des fragments, ou des lysats, ou des membranes de cellules comprenant une 
telle proteine; et eventuellement un substrat enzymatique adequat, et 
-a mesurer le transfert d'energie. 

* * 

35. Procede selon la revendication 34 caracterise en ce que la proteine de 
fusion donneur d'energie est une proteine de fusion entre le recepteur 
de la leptine, ou une partie substantielle du recepteur de la leptine et la 
luciferase ou une partie substantielle de la luciferase, et la proteine de 
fusion accepteur d'energie est une proteine de fusion selon la 
revendication 22. 



36. Procede selon la revendication 34 caracterise en ce que la proteine de 
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30. Fragments de cellules selon Tune des revendications 28 et 29. 

■ 

31. Lysat de cellules selon Tune des revendications 28 et 29. 

* « 

32. Membranes de cellules selon Tune des revendications28 et 29. 

33. Procede de determination de la modification de Pinteraction entre une proteine 
presentant une identite d'au moins 65% avec la sequence SEQ ID N°4 ou la 
sequence SEQ ID N°16, et le recepteur de la leptine par un compose comprenant 
les etapes consistant a : 

-mettre en contact ledit compose avec une proteine presentant une identite d'au moins 
65% avec la sequence SEQ ID N°4 ou la sequence SEQ ID N°16, et le recepteur de la 
leptine, ou des cellules, ou des fragments, ou des lysats, ou des membranes de cellules 
comprenant de telles proteines, et eventuellement un substrat enzymatique adequat, et 
-a mesurer l'interaction entre la proteine presentant une identite d'au moins 65% avec 
la sequence SEQ ID N°4 ou la sequence SEQ ID N°16, et le recepteur de la leptine. 

34. Procede de determination de la modification de l'interaction entre une proteine 
presentant une identite d'au moins 65% avec la sequence SEQ ID N°4 ou la 
sequence SEQ ID N°16, et le recepteur de la leptine par un compose comprenant 
les etapes consistant k : 

-mettre en contact ledit compose avec une proteine de fusion selon la revendication 
19, et une proteine de fusion entre le recepteur de la leptine, ou une partie substantielle 
du recepteur de la leptine, et une proteine donneur d'energie ou une proteine accepteur 
d'energie, ou une partie substantielle et active d'une proteine donneur d'energie ou 
accepteur d'energie, ou des cellules, ou des fragments, ou des lysats, ou des 
membranes de cellules comprenant de telles proteines, et eventuellement un substrat 
enzymatique adequat, et 
-a mesurer le transfer! d'energie. 

35. Procede selon la revendication 34 caracterise en ce que la proteine de fusion 
donneur d'energie est une proteine de fusion entre le recepteur de la leptine, ou 
une partie substantielle du recepteur de la leptine et la luciferase ou une partie 
substantielle de la luciferase, et la proteine de fusion accepteur d'energie est une 
proteine de fusion selon la revendication 22. 

36. Procede selon la revendication 34 caracterise en ce que la proteine de fusion 
donneur d'energie est une proteine de fusion selon la revendication 20, et la 
proteine de fusion accepteur d'energie est une proteine de fusion entre le recepteur 
de la leptine, ou une partie substantielle du recepteur de la leptine et la YFP ou une 
partie substantielle de la YFP. 

37. Procede selon la revendication 34 caracterise en ce que le transfert d'energie 
mesure en presence du compose a tester est compare a celui mesure en absence du 
compose a tester. 

38. Procede selon la revendication 34 caracterise en ce que le transfert d'energie 
mesure en presence du compose a tester et de la leptine (ou un ligand du 
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fusion donneur d'energie est une proteine de fusion selon la 
revendication 20, et la proteine de fusion accepteur d'energie est une 
proteine de fusion entre le recepteur de la leptine, ou une partie 
substantielle du recepteur de la leptine et la YFP ou une partie 
substantielle de la YFP. 

37.Procede selon la revendication 34 caracterise en ce que le transfert 
d'energie mesure en presence du compose a tester est compare a celui 
mesure en absence du compose a tester. 



38. Precede selon la revendication 34 caracterise en ce que le transfert 
d'energie mesure en presence du compose a tester et de la leptine (ou 
un ligand du recepteur),est compare a celui mesure en presence du 
compose en absence de leptine (ou un ligand du recepteur). 

39. Procede de criblage ou de detection de composes destines a la 
prevention et / ou au traitement de pathologies liees a la leptine 
comprenant les .etapes consistent a : 

-mettre en contact ledit compose avec une proteine presentant une identite 
d'au moins 65% avec la sequence SEQ ID N°4 ou la sequence SEQ ID N°16, 
et le recepteur de la leptine, ou des cellules, ou des fragments, ou des lysats, 
ou des membranes de cellules comprenant de telles proteines, ;et 
eventuellement un substrat enzymatique adequat, et *; 
-a mesurer Interaction entre une proteine presentant une identite d'au moms 
65% avec la sequence SEQ ID N°4 ou la sequence SEQ ID N°16, eye 
recepteur de la leptine. 4 v 

40. Procede selon I'une des revendications 34 et 35 caracterise en ce que 
la proteine de fusion est une proteine de sequence SEQID N°6, SEQID 
N°8, SEQID N°12, SEQID N°14, SEQID N°18 ou SEQID N°20. 

41. Procede selon I'une des' revendications 33 a 40 caracterise en ce que 
les cellules sont traites par un agent permeabilisant. 



recue le 28/07/03 



recepteur),est compare a celui mesure en presence du compose en absence de 
leptine (ou un ligand du recepteur). 

39. Precede de criblage ou de detection de composes destines a la prevention et / ou au 
5 traitement de pathologies liees a la leptine comprenant les etapes consistant a : 

-mettre en contact ledit compose avec une proteine presentant une identite d'au moins 
65% avec la sequence SEQ ID N°4 ou la sequence SEQ ID N°16, et le recepteur de la 
leptine, ou des cellules, ou des fragments, ou des lysats, ou des membranes de cellules 
comprenant de telles proteines, et eventuellement un substrat enzymatique adequat, et 
10 -a mesurerl 'interaction entre une proteine presentant une identite d'au moins 65% avec la 

sequence SEQ ID N°4 ou la sequence SEQ ID N°16, et le recepteur de la leptine. 

40. Precede selon Tune des revendications 34 et 35 caracterise en ce que la proteine de 
fusion est une proteine de sequence SEQID N°6, SEQID N°8, SEQID N°12, 

15 SEQID N°14, SEQID N°18 ou SEQID N°20. 

41. Precede selon Tune des revendications 33 a 40 caracterise en ce que les cellules 
sont trait es par un agent permeabilisant. : 



1 er depot 



1/12 



Figure 1: . ..... 

3'-teg- G*G!G C*C *C*G G*C A*C*C H*T*C* C T*T*C*G 
3 * -teg-GlGlGlTlC A A G*C*C"*C • T*C*T G*T A*C*C*G 
3 • ~teg-GlCiCicl_T*C*T G*T A*C*C K*C*r* C G*C*A*A 
3 \ -£eg-TfMCjlC_G*C*C*C g*C A a^t^t^t^ c: G A*G*A 
3 • -teg-TlT!ClG__A G A*G*C A*C*C G*T A A*T A*G*G 
3 . -teg-GlMAiT_^*C G A*C*C*C*T A*C A*C G G*A*A. 
.3 - -teg-A^C^A^C_G G A A*T*C*T C*C*T*A A*T A*C*C 
• 3 1 -teg-ClTiCiC^T A A*T A*C*C G*C A A* A*T G*A*C 
3 ' -^gg- C*C*G*C*A A A*T G A*C*C*G G G A*A T*A*A 
1 ' -f.ftg- A*C*G G A *C A G*C*C*C T*T*G A*C*C G*T*A 
1 ' -t-.gg- G*G*A*-C A G*C*C*C T*T*G A*C*C G*T A*T A*A*A 
3 « -j-.e>g- G*C*C*C T *T*G A*C*C G*T A*T A A* A G*A*A 
3 ' -f.ftg- G*G*A A*C *A*C A A*C*C*G T*C*C*G T*T*A*C 
3 ' -f.P.g- T*G*T A*C A*C G*T G*T A*C G*H* C G*T A*A 
^ ■ -j-Rg- Q*C*C*T C *C*T G*T C*C*A G*C?*C* G C*C*A*A 
3 - -teg-G!GiA^C*C G A*C*A T*T*G C*A*C G*T C*T A* A*A 



*: Thioester 

2 f O-Methylation 
teg: espaceur Triethylenglycol 
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Figure 2 

10 20 30 40 50 60 



OB - RGRP_humain*e = -M&G-VKALVAL3F SGAIGLTFLMLGCALEDYGVYWPLFVLIFHAIS 

My4 7_humaine : MAG-IKALISLBFGGAiGLMFLMLGCftLPIYNKyWPriFVLFF'riLS 

y 1 0 2J3 . elegans MGGHIHIQCFDCCSMKOTILAV^ 

YJ14J&evure — - -« MMEFfeVS PLTKIISLSGFL A^GFLLVIL SCAL- -FHOTiPLFDILiFLLA 

♦ ; * a ♦ * ♦ * ♦ t X tV a 7f * * a » 7T ♦ * * ♦ 

Consensus MGCH IHIQCF 222 2M&G2 IKA LI 2L SF 4 GAIGLTFIiML GCAL P 3 YG4 YWPLF V2 4 F Y4 Ii S 

70" 80 90 100 110 120 

I I I I I I 

OB - RGRP^frumaine PIPHFIAKR VT YD SB ATS SACRELAYFFTTGIVVSAFGFPVILARVAVIKWGACG 

My47_humairie PIPYCIARR- - - - - LVDDTDAMSNACKELAIFLTTGIVVS AFGLP XVFARAHLIEWGACA 

yfc0 2_C.. elegans PtfPLLIARR- - — 

Ytfl4_JLevure P IPNTIFl^AGNKYHi' § DFMS D S SisJTGQDtj ZUIF LTGfc^VT SGI AL P VVF YHCQL I GHL SCI 

» » » » * • ♦ »■ 

Consensus P IP44 IARRGNKYH4 4DDMDATSNAC4 ELA4FLTTGI WSAF 2 LP 2 Y2 A2 A4 LI4 WGAG4 



130 140 . 150 

1 I I 

OB - RGRP_humaine LVLAGNAVIFLTIQGFFLIFGRGDDFS WEQW- 

My47__humaine L\fcT<3N^ : ^ 

yt 0 2_C . elegans LIFXANS fovlF iS VI IF YFR iFlJGEbMNGrMS LW - 
YOU 4 JO. evti re MCMI GGL IIYSSIVI FKWFFKKDFHED DSLFG 

* * • • * • 

Con s en sus LVL I GN4 2 IF STI4 iSF-FL IFQ4 4 CDF'S WS 2 WG 
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Figure 4 a 



Figure 4B 
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Figure 5 
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Figure 8 a 
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Figure 10a 
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Figure 12 
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LISTE DE SEQUENCES 

<110> AVENTIS PHARMA 
<12 0> ANT I SENS OB RGRP 

* 

<13 0> ANTISENS OB RGRP 

<140> 
<141> 

<160> 21 

<170> "Patentln Ver . 2.1 

■ 

<210> 1 

<211> 648 

<212> ADN 

<213> Homo sapiens 

<400> 1 " 

eactttattc tgattacagt gcattgaatt tcttagaact catactatct gtatacatgt 60 
gcacatgcgg cattttacta tgaaatttaa tatgctgggt tttttaatac ctttatatat 12 0 
catgttcact ttaagaaaga cttcataagt aggagatgag ttttattctc agcaaataga 180 
cctgtcaaat ttagattatg ttactcaaat tatgttactt gtttggctgt* tcatgtagtc 240 
acggtgctct cagaaaatat attaacgcag tcttgtaggc agctgccacc ttatgcagtg 3 00 
catcgaaacc ttttgcttgg ggatgtgctt ggagaggcag ataacgctga agcaggcctc 3 60 
tcatgaccca ggaaggccgg ggtggatccc tctttgtgtt gtagtccatg ctattaaaag 42 0 
tgtggcccac agaccaagag cctcaacatt tcctagagcc ttattagaaa tgcagaatct 480 
gaagccccac tctggaccca ggacat.tt.tg atgagatcca aaggagttgt atgcacatga 540 
aagtttgaga agcatcatca tagagaagta aacatcacac ccaacttcct tatctttcca 600 
gtggctaaac cacttaacct ctctgggtgt tacctgctca tttgttta 648 



<210> 2 : 
<211> 20 ', 
<212> ADN 

<213> Sequence artificielle 



<220> 

<223> Description de la sequence artificielle : antisens v ' 
AS14 

<400> 2 

aatgccgcat gtgcacatgt 20 



<210> 3 



1er depot 



att caa ggg ttt ttc ctt ata ttt gga aga gga gat gat ttt age tgg 
lie Gin Gly Phe Phe Leu He Phe Gly Arg Gly Asp Asp Phe Ser Trp 
115 120 125 



gag cag tgg tag 
Glu Gin Trp 
130 



48 



96 



144 



<211> 396 
<212> ADN 

<213> Homo sapiens 

V 

<220> 
<221> CDS 
<222> (1) . . (396) . 

<400> 3 

atg gcg ggc gtt aaa get etc gtg gca tta tec ttc agt ggg get att 

Met Ala Gly Val Lys Ala Leu Val Ala Leu Ser Phe' Ser Gly Ala He 

1 5 10 15 

gga ctg act ttt ctt atg ctg gga tgt gec tta gag gat tat ggc gtt 
Gly Leu Thr Phe Leu Met Leu Gly Cys Ala Leu Glu Asp Tyr Gly Val 

20, 25 30 

tac tgg ccc tta ttc gtc ctg att ttc cac gee ate tec ccc ate ccc 
Tyr Trp Pro Leu Phe Val Leu He Phe His Ala He Ser Pro He Pro 

35 40 45 

cat ttc att gee aaa aga gtc acc tat gac tea gat gca ace agt agt 
His Phe lie Ala Lys Arg Val Thr Tyr Asp Ser Asp Ala Thr Ser Ser 

50 55 60 

gec tgt egg gaa ctg gca tat ttc ttc act act gga att gtt gtt tct 240' 
Ala Cys Arg Glu Leu Ala Tyr Phe Phe Thr Thr Gly He Val Val Ser 
65 70 75 80 

gec ttt gga ttt cct gtt att ctt get cgt gtg get gtg ate aaa tgg 2 88 
Ala Phe G±y Phe Pro Val He Leu Ala Arg Val Ala Val He Lys Trp 

85 90 95 

gga gec tgc ggc ctt gtg ttg gca ggc aat gca gtc att ttc ctt aca 33 6 
Gly Ala Cys Gly Leu Val Leu Ala Gly Asn Ala Val He Phe Leu Thr 

100 105 HO 



192 



384 



396 



<210> 4 
<211> 131 



2 



1 er depot 



<212> PRT 

<213> Homo sapiens 



<400> 4 

Met Ala Gly Val 
1 

Gly Leu Thr Phe 

20 

Tyr Trp Pro Leu 

35 

His Phe lie Ala 
50 

Ala Cys Arg Glu 
65 

Ala Phe Gly Phe 



Gly Ala Cys Gly 

100 

lie Gin Gly Phe 
115 



Lys Ala Leu Val 
5 

Leu Met Leu Gly 



Phe Val Leu He 

40 

Lys Arg Val Thr 

■ 55 

Leu Ala Tyr Phe 
70 

Pro Val He Leu 
85 

Leu Val Leu Ala 



Phe Leu He Phe 

120 



Ala Leu Ser Phe 
10 

Cys Ala Leu Glu 
25 

Phe His Ala He 



Tyr Asp Ser Asp 

60 

Phe Thr Thr Gly 

75 

Ala Arg Val Ala 
90 

Gly Asn Ala Val 
105 

Gly Arg Gly Asp 



Ser Gly Ala He 

15 

Asp Tyr Gly Val 
30 

Ser Pro He Pro 
45 

Ala Thr Ser Ser 



He Val Val Ser 

80 

Val lie Lys Trp 

95 

He Phe Leu Thr 
110 

Asp Phe Ser Trp 
125 



Glu Gin Trp 
130 



<210> 5 
<211> 1359 
<212> ADN 

<213> Sequence artificielle 

<220> 

<221> CDS 

<222> (1) . . (1359) 

* 

<220> 

<223> Description de la sequence artificielle : OB RGRP 
LUC 



<400> 5 

atg gcg ggc gtt aaa get etc gtg gca tta tec ttc agt ggg get att 



1 er depot 



96 



ggc aac gcc get age age 'tac ctg tgg agg cac -gtg gtg ccc cac ate 



144 



192 



240 



288 



Met Ala Gly Val Lys Ala Leu Val Ala Leu Ser Phe Ser Gly Ala lie 
15 10 .15 

gga ctg act ttt ctt- atg ctg gga tgt gcc tta gag -gat: tat ggc gtt 
Gly Leu Thr Phe Leu Met Leu Gly Cys "Ala Leu Glu Asp Tyr Gly V f l 

20 25 30 

tac tgg ccc tta ttc gtc ctg att etc' cac gcc ate tec ccc ate ccc 
Tyr Trp Pro Leu Phe Val Leu He Phe His Ala He Ser Pro He Pro 

35 40 45 

cat ttc att gcc aaa aga gtc acc tat gac tea gat gca ace agt agt 
His Phe He Ala Lys Arg Val Thr Tyr Asp Ser Asp Ala Thr Ser Ser 
50 55 60 

gcc tgt egg gaa ctg gca tat ttc ttc act act gga att gtt gtt tct 
Ala Cys Arg Glu Leu Ala Tyr Phe Phe Thr Thr Gly He Val Val Ser 
65 70 75 80 

gcc ttt gga ttt cct gtt att ctt get cgt gtg get gtg ate aaa tgg 
Ala Phe Gly Phe Pro Val He Leu Ala Arg Val Ala Val He Lys Trp 

85 90 95 

gga gcc tgc ggc ctt gtg ttg gca ggc aat gca gtc att ttc ctt aca 
Gly Ala Cys Gly Leu Val Leu Ala Gly Asn Ala Val He Phe Leu Thr 

100 105 no 

att caa ggg ttt ttc ctt ata ttt gga aga gga gat gat ttt age tgg 
He Gin Gly Phe Phe Leu He Phe Gly Arg Gly Asp Asp Phe Ser Trp 
115 120 125 

gag cag tgg att ccg ggg gat cca ccg get aga- gcc acc atg acc age 
Glu Gin Trp He Pro Gly Asp Pro Pro Ala Arg Ala Thr Met Thr Ser . 
130 135 ' I 40 

aag gtg tac gac ccc gag cag agg aag agg atg ate acc ggc ccc cag 
Lys Val Tyr Asp Pro Glu Gin Arg Lys Arg Met He Thr Gly Pro Gin 
145 150 155 160 

tgg tgg gcc agg tgc aag cag atg aac gtg ctg gac age ttc ate aac 
Trp Trp Ala Arg Cys Lys Gin Met Asn Val Leu Asp Ser Phe He Asn 

165 ' 170 175 

tac tac gac age gag aag cac gcc gag aac gcc gtg ate ttc ctg cac 576 
Tyr Tyr Asp Ser Glu Lys His Ala Glu Asn Ala Val He Phe Leu His 

180 185 190 



336 



384 



432 



480 



528 



624 



4 



672 



720 



1er depot . .... 

Gly Asn Ala Ala Ser Ser Tyr Leu Trp Arg His Val Val Pro His He 
195 200 20 -" : 

gag ccc gtg gcc aggtgc ate ate cccgat ctg ate ggc atg ggc aag 
Glu Pro Val Ala Arg Cys He He Pro Asp Leu He Gly Met Gly Lys 
210 215 220 

age gge aag age ggc aac ggc age tac agg ctg ctg gac cac tac aag 
Ser Gly Lys Ser Gly Asn Gly Ser Tyr Arg Leu Leu Asp His. Tyr Lys 

ota 235 240 

225 230 

tac ctg acc gcc tgg ttc gag etc ctg aac ctg ccc aag aag ate ate 
Tyr Leu Thr Ala Trp Phe Glu Leu Leu Asn Leu Pro Lys Lys He He 

245 250 255 

ttc gtg ggc cac gac tgg ggc gcc tgc ctg gcc ttc cac tac age tac 
Phe Val Gly His Asp Trp Gly Ala Cys Leu Ala Phe His Tyr Ser Tyr 

260 265 270 

gag cac cag gac aag ate aag gcc ate gtg cac gcc gag age gtg gtg 864 
Glu His Gin Asp Lys He Lys Ala He Val His Ala Glu Ser Val Val 
275 280 285 

gac gtg ate gag age tgg gac gag tgg cca gac ate gag gag gac ate 912 - 
Asp Val He Glu Ser Trp Asp Glu Trp Pro Asp He Glu Glu Asp He £ 
290 295 300 



768 



816 



gcc ctg ate aag age gag gag ggc gag aag atg gtg ctg gag aac aac 9 60 
Ala Leu He Lys Ser Glu Glu Gly Glu Lys Met Val Leu Glu Asn Asn 
305 310 315 320 

ttc ttc gtg gag acc atg ctg ccc age aag ate atg aga aag ctg gag 1008 
Phe Phe Val Glu Thr Met Leu Pro Ser" Lys He Met Arg Lys Leu Glu 

325 330 335 

ccc gag gag ttc gcc gcc tac ctg gag ccc ttc aag gag aag ggc gag 1056 
Pro Glu. Glu Phe Ala Ala Tyr Leu Glu Pro Phe Lys Glu Lys Gly Glu 

340' 345 350 

gtg aga aga ccc acc ctg age tgg. ccc aga gag ate ccc ctg gtg aag 1104 
Val Arg Arg Pro Thr Leu Ser Trp Pro Arg Glu He Pro Leu Val Lys 
355 360 . 365 ' 

ggc ggc aag ccc gac gtg gtg cag ate gtg aga aac tac aac gcc tac 1152 
Gly Gly Lys Pro Asp Val Val Gin lie Val Arg Asn Tyr Asn Ala Tyr 
370 375 380 



V 



ctg aga gcc age gac gac ctg ccc aag atg ttc ate gag age gac ccc 



1200 



5 



1 er depot 



1248 



Leu Arg Ala Ser Asp Asp Leu Pro Lys Met Phe lie Glu Ser Asp Pro 
385 390 395 • " 400 

ggc ttc ttc age aac gec ate gtg gag ggc gecaag aag ttc ccc aac 
Gly Phe Phe Ser Asn Ala lie- Val Glu Gly Ala Lys Lys Phe Pro -Ash. 

405 '410 ' ' 415 

acc gag ttc gtg aag gtg aag ggc ctg cac ttc age cag gag gac gec . 1296 
Thr Glu Phe Val Lys Val Lys Gly Leu His Phe Ser Gin Glu Asp Ala 

420 425 430 



ccc gac gag atg ggc aag tac ate aag age ttc gtg gag aga gtg ctg 
Pro Asp Glu Met Gly Lys Tyr lie Lys Ser Phe Val Glu Arg Val Leu 
435 440 445 

aag aac gag cag taa 
Lys Asn Glu Gin 
450 



1344 



1359 



<210> 6 
<211> 452 
<212> PRT 

<213> Sequence artificielle 

<223> Description de la sequence artif icielle:OB RGRP 
LUC 

<400> 6 

Met Ala Gly Val Lys Ala Leu Val Ala Leu Ser Phe Ser Gly Ala lie 
15 10 15 

Gly Leu Thr Phe Leu Met Leu Gly Cys Ala Leu Glu Asp Tyr Gly Val 

20 25 30 

Tyr Trp Pro Leu Phe Val Leu lie Phe His Ala lie Ser Pro lie Pro 

35 40 45 

His Phe lie Ala Lys Arg Val Thr Tyr Asp Ser Asp Ala Thr Ser Ser 
50 55 60 

Ala Cys Arg Glu Leu Ala' Tyr Phe Phe Thr Thr Gly lie Val Val Ser 

™ 75 ' 80 

65 70 /D 

Ala Phe Gly Phe Pro Val lie Leu Ala Arg' Val Ala Val He Lys Trp 

85 " 90 95 

Gly Ala Cys Gly Leu Val Leu Ala Gly Asn Ala Val He Phe Leu Thr 

100 105 • HO 



6 
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He Gin Gly Phe Phe Leu He Phe Gly Arg Gly Asp Asp .?he Ser Trp 
115 120 125 

Glu Gin Trp He Pr.o Gly Asp Pro Pro Ala Arg Ala Thr Met Thr Ser 
130 135 140 

Lys Val Tyr Asp Pro Glu> Gin Arg Lys Arg Met lie Thr Gly Pro Gin 
145 150 155 -160 

Trp Trp Ala Arg Cys Lys Gin Met Asn Val Leu Asp Ser Phe He Asn 

165 ■ , 170 175 

Tyr Tyr Asp Ser Glu Lys His Ala Glu Asn Ala Val He Phe Leu His 

180 185 190 

Gly Asn Ala Ala Ser Ser Tyr Leu Trp Arg His Val Val Pro His He 
195 200 205 

Glu Pro Val Ala Arg Cys lie He Pro Asp Leu He Gly Met Gly Lys 
210 215 220 

Ser Gly Lys Ser Gly Asn Gly Ser Tyr Arg Leu Leu Asp His Tyr Lys 
225 230 235 240 

Tyr Leu Thr Ala Trp Phe Glu Leu Leu Asn Leu Pro Lys Lys He He 

245 250 255 

Phe Val Gly His Asp Trp Gly Ala Cys Leu Ala Phe His Tyr Ser Tyr 

260 265 270 

Glu His Gin Asp Lys He Lys Ala He Val His Ala Glu Ser Val Val 
275 280 ' 285 

Asp Val He Glu Ser Trp Asp Glu Trp Pro Asp He Glu Glu Asp He 
290 295 300 

V 

Ala Leu lie Lys Ser Glu Glu Gly Glu Lys Met Val Leu Glu Asn Asn 

-3 1 a 315 320 

305 • 310 Jx:3 

Phe Phe Val Glu Thr Met Leu Pro Ser Lys- He Met Arg Lys Leu Glu 

325 330 335 

Pro Glu Glu Phe Ala Ala Tyr Leu Glu Pro Phe Lys Glu Lys Gly Glu 

340 345 350 

Val Arg Arg Pro Thr Leu Ser Trp Pro Arg Glu He Pro Leu Val Lys 
355 360 365 



1er d4'p6t "' ' ' ■ 



Gly Gly Lys Pro Asp Val Val Gin He Val Arg Asn -Cyr Asn Ala Tyr 
370 375 380 



Leu Arg Ala Ser Asp Asp Leu Pro Lys Met Phe He- Glu Ser Asp Pro 
385 ' 390 395 .. 400 

Gly Phe Phe Ser Asn Ala He Val Glu Gly Ala U s Lys Phe Pro Asn 

405 .410 415 

Thr Glu Phe Val Lys Val Lys Gly Leu His Phe Ser Gin Glu Asp Ala 

420 -425 " 430 

Pro Asp Glu Met Gly Lys Tyr He Lys Ser Phe Val Glu Arg Val Leu 
435 440 445 

■ * 

Lys Asn Glu Gin 
450 



<210> 7 
<211> 1128 
<212> ADN 

<213> Sequence artif icielle 

<220> 

<221> CDS 

<222> (1) . . (1128) 

<220> 

<223> Description de la 'sequence artif icielle : OB RGRP 
YFP • 

<400> 7 

atg gcg ggc gtt aaa get etc gtg gca tta tec ttc agt ggg get att 

Met Ala Gly Val Lys Ala Leu Val Ala Leu Ser Phe Ser Gly Ala lie 
1 5 10 15 

gga ctg act ttt ctt atg ctg gga tgt gee tta gag gat tat ggc gtt 
Gly Leu Thr Phe Leu Met Leu Gly Cys Ala Leu Glu Asp Tyr Gly Val 

20 25 30 

tac tgg ccc tta ttc gtc ctg att ttc cac gec ate .tec ccc ate ccc 
Tyr Trp Pro Leu Phe Val Leu He Phe His Ala He Ser Pro He Pro 

35 40 45 

cat ttc att gee aaa aga gtc ace tat gac tea gat gca ace agt agt 



8 



1er depot 

His Phe lie Ala Lys Arg Val Thr Tyr Asp Ser Asp Ala Thr Ser Ser 
50 



55 60 



gcc tgt egg gaa ctg gca tat ttc ttc act act gga att gtt gtt tct 
Ala Cys Arg Glu Leu Ala Tyr Phe Phe Thr Thr Gly He Val Val Ser 



240 



65 



70 



288 



gcc ttt gga ttt cct gtt att ctt get cgt gtg get gtg ate aaa tgg 
Ala Phe Gly Phe Pro Val He Leu Ala Arg Val Ala Val He Lys Trp 

85 . 90 95 

gga gcc tgc ggc ctt gtg ttg gca ggc aat gea gtc att ttc ctt aca .336 
Gly Ala Cys Gly Leu Val Leu Ala Gly Asn Ala Val He Phe Leu Thr 

100 - 105 HO 

att caa ggg ttt ttc ctt ata ttt gga aga gga gat gat ttt age tgg 384 
lie Gin Gly Phe Phe Leu He Phe Gly Arg Gly Asp Asp Phe Ser Trp 
115 



120 125 



gag cag tgg att ccg gtc gcc acc atg gtg age aag ggc gag gag ctg 432 
Glu Gin Trp He Pro Val Ala Thr Met Val Ser Lys Gly Glu Glu Leu 



130 



135 140 



480 



ttc acc ggg gtg gtg cec ate ctg gtc gag ctg gac ggc gac gta aac 
Phe Thr Gly Val Val Pro He Leu Val Glu Leu Asp Gly Asp Val Asn 
145 150 1" 160 

ggc cac aag ttc age gtg tec ggc gag ggc gag gge gat gee aec tac 52 8 
Gly His Lys Phe Ser Val Ser Gly Glu Gly Glu Gly Asp Ala Thr Tyr 

165 170 I 75 

ggc aag ctg acc ctg aag ttc ate tgc. ace ace ggc aag ctg ccc gtg . 57 6 
Gly Lys Leu Thr Leu Lys Phe He Cys Thr Thr Gly Lys Leu Pro Val 

180 185 190 

cee "tgg ccc acc etc gtg acc ace ttc ggc tac gge gtg cag tge ttc 624 
Pro Trp-Pro Thr Leu Val Thr Thr Phe Gly Tyr Gly Val Gin Cys Phe 
195 



200 205 



gcc cgc tac ccc gac cac atg cgc cag cac gac ttc ttc aag tec gcc 
Ala Arg Tyr Pro Asp His Met Arg Gin His Asp Phe Phe Lys Ser Ala 



672 



210 



215 220 



720 



atg ccc gaa ggc tac gtc cag gag cgc aec ate ttc ttc aag gac gac 
Met Pro Glu Gly Tyr Val Gin Glu Arg Thr He Phe Phe Lys Asp Asp 

ggc aac tac aag acc cgc gee gag gtg aag ttc gag ggc gac aec ctg 7 68 



9 



1er depof 1 



_ pln Ua i two phe Glu Gly Asp Thr Levi 
Gly Asn Tyr Lys Thr Arg Ala Glu Val Lys i ne u± y * 

245 " ■ . • 250 * 

gtg aac cgc ate gag ctg aag ggc ate gac ttc aag gag gac ggc aac 

x Tio rlu Leu Lvs Gly He Asp Phe Lys Glu Asp Gly Asn 
Val Asn Arg He Glu Leu i^ys ^j-y . ^ , . 



816 



260 



265 



ate ctg ggg cac aag ctg gag tac aac tac aac age cac aac gtc tat 
Xle Leu Gly His Lys Leu Glu Tyr Asn Tyr Asn Ser His Asn Val Tyr 

2 ob 



864 



275 



280 



ate atg gee gac aag eag aag aae gge ate aag gtg aac ttc aag ate 
ate atg go y phe Lys Jle 

He Met Ala Asp Lys Gin Lys Asn Gly lie i_,ys 

9 qc 300 

290 2yb 

cgc eae aae ate gag gae gge age gtg eag ete gee gae eae tac eag 

. * Ti„ nu Aso Gly Ser Val Gin Leu Ala Asp His Tyr Gin 
Arg His Asn He Glu Asp ^iy v^x 



305 



310 



315 



cag aac acc ccc ate ggc gac ggc ccc gtg ctg ctg ccc gac aac cac 
Gin Asn Thr Pro He Gly Asp Gly Pro Val Leu Leu Pro Asp Asn Hxs 



325 



330 335 



tac ctg age tac eag tec gec ctg age aaa gac ccc aac gag aag cgc 
Tyr Leu Ser Tyr Gin Ser Ala. Leu Ser Lys Asp Pro Asn Glu Lys Arg 

340 345 3 50 

gat cac atg gtc ctg ctg gag ttc gtg ace gec gee ggg ate act etc 
Lp His Met Val Leu Leu Glu Phe Val Thr Ala Ala Gly He Thr Leu 
355 360 365 

ggc atg gac gag ctg tac aag taa ... 
Gly Met Asp Glu Leu Tyr Lys 
370 375 



912 



960 



1008 



1056 



1104 



1128 



<210> 8 
<211> 375 
<212> PRT 

<213> Sequence artif icielle 



<223> Description de la sequence artif icielle : OB RGRP 

* 

YFP 
<400> 8 



Met 



Ala Gly Val Lys Ala Leu Val Ala Leu Ser Phe Ser Gly Ala He 

1 A 15 



10 

1 5 



Oly Leu Thr Phe Leu Met Leu Gly Cys Ala Leu Glu Asp Tyr Gly Val 



10 



1 er deppt 



20 



25 30 



Tyr Trp Pro Leu Phe Val Leu lie Phe His Ala He Ser Pro He Pro 

35 ■ • .:, 40 45 

« 

His Phe He Ala Lys Arg Val Thr Tyr Asp Ser Asp Ala Thr Ser Ser 
50 55 60 

Ala Cys Arg Glu Leu Ala Tyr Phe Phe Thr Thr Gly He Val Val Ser 

in 75 80 

65 70 

Ala Phe Gly Phe Pro Val lie Leu Ala Arg Val Ala Val He Lys Trp 

85 u 9.9 95 

Gly Ala Cys Gly Leu Val Leu Ala Gly Asn Ala Val He Phe Leu Thr 

100 105 HO 

He Gin Gly Phe Phe Leu He Phe Gly Arg Gly Asp Asp Phe Ser Trp 
115 120 125 

» - 

Glu Gin Trp He Pro Val Ala Thr Met Val Ser Lys Gly Glu Glu Leu 
130 "5 140 

i 

Phe Thr Gly Val Val Pro He Leu Val Glu Leu Asp Gly Asp Val Asn 

icn 155 
145 150 X 

* 

Gly His Lys Phe Ser Val Ser Gly Glu Gly Glu Gly Asp Ala Thr Tyr 

165 ■ 170 I" 75 

Gly Lys Leu Thr Leu Lys Phe He Cys Thr Thr Gly Lys Leu Pro. Val 

180 



185 190 



Pro Trp Pro 
195 



Thr Leu Val Thr Thr Phe Gly Tyr Gly Val Gin Cys Phe 



200 205 



Ala Arg Tyr Pro Asp His Met Arg Glh His Asp Phe phe Lys Ser Ala 
210 215 220 

t Pro Glu Gly Tyr Val Gin Glu Arg Thr He Phe Phe Lys Asp Asp 



Me 

225 230 



235 240 



Gly Asn Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr Leu 

245 



250 255 



Val Asn Arg He Glu Leu Lys Gly He Asp Phe Lys Glu Asp Gly Asn 

260 



265 270 



le Leu Gly His Lys Leu Glu Tyr Asn Tyr Asn Ser His Asn Val Tyr 



11 



1er depot * * :: l * 

•ft 



275 280 • " 285 

■ > 

He Met Ala Asp Lys Gin Lys Asn Gly lie Lys Val Asn Phe Lys He 
290 - . 295- 300 

•: . . 

Arg His Asn He Glu Asp Gly Ser Val Gin Leu Ala Asp His Tyr Gin 
305 310 315 320 

Gin Asn Thr Pro He Gly Asp Gly Pro Val Leu Leu Pro Asp Asn His 

325 330 335 

Tyr Leu Ser Tyr Gin Ser Ala Leu Ser Lys Asp Pro Asn Glu Lys Arg 

340 345 ' 350 

Asp His Met Val Leu Leu Glu Phe Val Thr Ala Ala Gly He Thr Leu 
355 360 365 



Gly Met Asp Glu Leu Tyr Lys 
370 375 



<210> 9 

<211> 2691 

<212> ADN 

<213> Homo sapiens 

<220> 

<221> CDS 

<222> (1) . . (2691) 

<400> 9 

atg att tgt caa aaa ttc tgt gtg gtt ttg tta cat tgg gaa ttt. att 

Met He Cys Gin Lys Phe Cys Val Val Leu Leu His Trp Glu Phe He 

1 5 10 15 

tat gtg ata act gcg ttt aac ttg tea tat cca att act cct tgg aga 
Tyr Val He Thr Ala Phe Asn Leu Ser Tyr Pro He Thr Pro Trp .Arg 

20 25 30 

ttt aag ttg tct tgc atg cca cca aat tea acc tat gac tac ttc ctt 
Phe Lys Leu Ser Cys Met Pro Pro Asn Ser Thr Tyr Asp Tyr Phe Leu 

35 40 45 

ttg cct get gga etc tea aag aat act tea aat teg aat gga cat tat 
Leu Pro Ala Gly Leu Ser Lys Asn Thr Ser Asn -Ser Asn Gly His Tyr 
50 55 60 



48 



96 



144 



192 



12 



1er depot i , 



m 



gag aca get gtt gaa cct aag tttaat tea agt ggt act cac ttt tct 
Glu Thr Ala Val Glu Pro Lys Phe Asn Ser Ser Gly Thr His Phe Ser 
65 • 70 . . ■ 75 . 80 

aac tta tec aaa aca act ttc cac tgt tgc ttt egg agt gag caa gat 
Asn Leu Ser Lys Thr Thr Phe His Cys Cys Phe Arg Ser Glu Gin Asp 

85 90 95 

aga aac tgc tec tta tgt gca gac aac att gaa gga aag aca ttt gtt 
Arg Asn Cys Ser Leu Cys Ala Asp Asn He Glu Gly Lys Thr Phe Val 

100 105 HO 

tea aca gta aat tct tta gtt ttt caa caa ata gat gca aac tgg aac 
Ser Thr Val Asn Ser Leu Val Phe Gin Gin He Asp Ala Asn Trp Asn 
115 ' 120 125 

ata cag tgc tgg eta aaa gga gac tta aaa tta ttc ate tgt tat gtg 
He Gin Cys Trp Leu Lys Gly Asp Leu Lys Leu Phe lie Cys Tyr Val 
130 135 140 

gag tea tta ttt aag aat eta ttc agg aat tat aac tat aag gtc cat 
Glu Ser Leu Phe Lys Asn Leu Phe Arg Asn Tyr Asn Tyr Lys Val His 
145 150 155 160 

ctt tta tat gtt ctg cct gaa gtg tta gaa gat tea cct ctg gtt ccc 
Leu Leu Tyr Val Leu Pro Glu Val Leu Glu Asp Ser Pro Leu Val Pro 

165 170 175 

caa aaa ggc agt ttt cag atg gtt cac tgc aat tgc agt gtt cat gaa 
Gin Lys Gly Ser Phe Gin Met Val His Cys Asn Cys Ser Val His Glu 

180 185 190 

tgt tgt gaa tgt ctt gtg cct gtg cca aca gee aaa etc aac gac act 
Cys Cys Glu Cys Leu Val Pro Val Pro Thr Ala Lys Leu Asn Asp Thr 

'19 5: 200 . 205 

etc ctt atg tgt ttg aaa ate aca tct ggt gga gta att ttc cag tea 
Leu Leu Met Cys Leu Lys lie Thr Ser Gly Gly Val He. Phe Gin Ser 
210 ' 215 220 . ' 

cct eta atg tea gtt eag ccc ata aat atg gtg aag cct gat cca cca 
Pro Leu Met Ser Val Gin Pro lie Asn Met Val Lys Pro Asp Pro Pro 

ota ?35 240 

225 230 

tta ggt ttg cat atg gaa ate aca gat gat ggt aat tta aag att tct 
Leu Gly Leu His Met Glu He Thr Asp Asp Gly Asn Leu Lys He Ser 

245 250 255 



240 



288 



336 



384 



432 



480 



528 



576 



624 



672 



720 



768 



13 
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tgg tec age cca cca ttg .gta cca ttt cca ctt caa tat caa gtg aaa 816 
Trp Ser Ser Pro Pro Leu Val Pro Phe Pro Leu Gin Tyr Gin Val Lys 

260 



265 270 



tat tea gag aat tot aca aca gtt ate aga gaa get gac-aag-att gtc. . .864 
Tyr Ser Glu Asn Ser Thr Thr Val He Arg Glu Ala Asp. Lys He Val 
275 280 285 



tea get aca tec ctg eta gta gac agt ata ctt cct ggg tct teg tat 
Ser Ala Thr Ser Leu Leu Val Asp Ser He Leu Pro Gly Ser Ser Tyr 
290 295 300 

gag gtt cag gtg agg ggc aag aga ctg gat ggc cca gga ate tgg agt 
Glu Val Gin Val Arg Gly Lys Arg Leu Asp Gly "Pro Gly He Trp Ser 
305 310 315 320 

gac tgg agt act cct cgt gtc ttt acc aca caa gat gtc ata tac ttt 
Asp Trp Ser Thr Pro Arg Val Phe Thr Thr Gin Asp Val He Tyr Phe 

325 330 335 

cca cct aaa att ctg aca agt gtt ggg tct aat gtt tct ttt cac tgc 
Pro Pro Lys He Leu Thr Ser Val Gly Ser Asn Val Ser Phe His Cys 

340 345 350 

ate tat aag aag gaa aac aag att gtt ccc tea aaa gag att gtt tgg 
He Tyr Lys Lys Glu Asn Lys He Val Pro Ser Lys Glu He Val Trp 
355 360 365 

tgg atg aat tta get gag aaa att cct caa age cag tat gat gtt gtg 
Trp Met Asn Leu Ala Glu Lys He Pro Gin Ser Gin Tyr Asp Val Val 
370 375 380 

agt gat cat gtt age aaa gtt act ttt ttc aat ctg aat gaa acc aaa 

Ser Asp His Val Ser Lys Val Thr Phe Phe Asn Leu Asn Glu Thr Lys 

too 395 400 

385 390 J?z> 

cct cga gga aag ttt acc tat gat gca gtg tac tgc tgc aat gaa cat 
Pro Arg Gly Lys Phe Thr Tyr Asp Ala Val Tyr Cys Cys Asn Glu Hxs 

405 410 415 

gaa tgc cat cat cgc tat get gaa tta tat gtg att gat gtc aat ate 
Glu Cys His His Arg Tyr Ala Glu Leu Tyr Val He Asp val Asn He 

420 425 430 

aat ate tea tgt gaa act gat ggg tac tta act aaa atg act tgc aga 
Asn He Ser Cys Glu Thr Asp Gly Tyr Leu Thr Lys Met Thr Cys Arg 
435 440 445 



912 



960 



1008 



1056 



1104 



1152 



1200 



1248 



1296 



1344 



14 
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tgg tea acc agt aca ate cag. tea ctt gcg gaa age act ttg caa ttg 13 92 
Z Ser Thr Ser Thr lie Gin Ser Leu Ala Glu Ser Thr Leu Gin Leu 
450 455 460 



agg tat cat agg age age ctt tac tgt tct gat att cca tct att cat 
Ar g Tyr His Arg Ser Ser Leu Tyr Cys Ser Asp He Pro Ser He 
465 470 475 

ccc ata tct gag ccc aaa gat tgc tat ttg cag agt gat ggt ttt tat 
Pro He Ser Glu Pro L ys Asp Cys Tyr Leu Gin Ser Asp Gly Phe Tyr 

485 .490 . 495 

gaa tgc att ttc cag cca ate ttc eta tta tct ggc tac aca atg tgg 
Glu Cys He Phe Gin Pro He Phe Leu Leu Ser Gly Tyr Thr Met Tr P 

510 



500 



505 



att agg ate aat cae tct eta ggt tea ctt gac. tct cca cca aca tgt 
lie Arg He Asn His Ser Leu Gly Ser Leu Asp Ser Pro Pro Thr Cys 
515 



520 525 



gtc ctt eet gat tct gtg gtg aag cca ctg ect cca tee agt gtg aaa 
Val Leu Pro Asp Ser Val Val Lys Pro Leu Pro Pro Ser Ser Val Lys 



53 0 



535 540 



gca gaa att act ata aac att gga tta ttg aaa ata tct tgg gaa aag 

Ala Glu He Thr He Asn He Gly Leu Leu Lys He Ser Trp Glu Lys 

rr^r, 555 560 

545 



550 555 



cca gtc ttt cca gag aat aac ctt caa ttc cag att cgc tat ggt tta 
Pro Val Phe Pro Glu Asn Asn L,eu Gin Phe Gin He Arg Tyr Gly Leu 

565 «r 



570 575 



agt gga aaa gaa gta caa tgg aag atg tat gag gtt tat gat gca aaa 
Ser Gly Lys Glu Val Gin Trp Lys Met Tyr Glu Val Tyr Asp Ala Lys 

580 * 585 

tea aaa tct gtc agt. etc cca gtt cca gac ttg tgt gca gtc tat get 
Ser Lys <Ser Val Ser Leu Pro Val Pro Asp Leu Cys Ala. Val Tyr Ala 



1440 



595 



600 605 



gtt cag gtg cgc tgt aag agg eta gat gga ctg gga tat tgg agt aat 
Val Gin val Arg Cys Lys- Arg Leu Asp Gly Leu Gly Tyr Trp Ser Asn 



1488 



fi1 c 620 
610 61b 



tgg age aat cca gee tac aca gtt gtc. atg gat ata aaa gtt cc.t atg 
T !p ser Asn Pro Ala Tyr Thr Val Val Met Asp He Lys Val Pro Met 

630 «5 _ 



1536 
i 



1584 



1632 



«- w 



1680 



1728 



1776 



1824 



1872 



1920 



1er d6pot ? 



1968 



690 695 700 

tgg aca gag caa gca cat act gtt acg gtt ctg gcc ate aat tea att 
Trp Thr Glu Gin Ala His Thr Val Thr Val Leu Ala He Asn Ser He 
705 710 715 720 

ggt get tct gtt gca aat ttt aat tta ace ttt tea tgg cct atg age 
Gly Ala Ser Val Ala Asn Phe Asn Leu Thr Phe Ser Trp Pro Met Ser 

725 730 735 

aaa gta aat ate gtg cag tea etc agt get tat cct tta aac age agt 
Lys Val Asn He Val Gin Ser Leu Ser Ala Tyr Pro Leu Asn Ser Ser 

740 745 750 

tgt gtg att gtt tec tgg ata eta tea ccc agt gat tac aag eta atg 
Cys Val He Val Ser Trp He Leu Ser Pro Ser Asp Tyr Lys Leu Met 
755 760 - 765 

tat ttt att att gag tgg aaa aat ctt aat gaa gat ggt gaa ata aaa 
Tyr Phe He He Glu Trp Lys Asn Leu Asn Glu Asp Gly Glu He Lys 
770 775 780 

tgg ctt aga ate tct tea tct gtt aag aag tat tat ate cat gat cat 
Trp Leu Arg He Ser Ser Ser Val Lys Lys Tyr Tyr He His Asp His 

' nan 795 800 

785 790 

ttt ate ccc att gag. aag tac cag ttc agt ctt tac cca ata ttt atg 
Phe He Pro He Glu Lys Tyr Gin Phe Ser Leu Tyr Pro He Phe Met 

805 810 815 

gaa gga gtg gga aaa cca aag ata att aat agt ttc act. caa gat gat 
Glu Gly Val Gly Lys Pro Lys He He Asn Ser Phe Thr Gin Asp Asp 

820 ■ . 825 830 



2016 



aga gga cct gaa ttt tgg aga ata att aat gga gat- act atg aaa aag 
Arg Gly Pro Glu Phe Trp Arg He He Asn Gly Asp Thr Met Lys Lys 

645 650 ". 1 655 

gag aaa aat gtc act tta ctt tgg aag ccc ctg atg aaa aat gac tea 
Glu Lys Asn Val Thr Leu Leu Trp Lys Pro Leu Met Lys Asn Asp Ser 

660 665 • 670 

ttg tgc agt gtt cag aga tat gtg ata aac cat cat act; tec tgc aat 
Leu Cys Ser Val Gin Arg Tyr Val He Asn His His Thr Ser Cys Asn 
675 680 685 

gga aca tgg tea gaa gat gtg gga aat cac acg aaa ttc act ttc ctg . 2112 
Gly Thr Trp Ser Glu Asp Val Gly Asn His Thr Lys Phe Thr Phe Leu 

/rnc: 700 



2064 



2160 



2208 



2256 



2304 



2352 



2400 



2448 



2496 



16 
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att gaa aaa cac cag' agt gat gca ggt tta tat gta att gtg oca gta 
lie Glu Lys His Gin Ser Asp Ala Gly Leu Tyr Val He Val Pro Val 
835 840 - 845 

att att tec tot tec ate tta ttg ett gga aea tta tta ata tea cac 
He He Ser Ser Ser He Leu Leu Leu Gly Thr Leu Leu He Ser His 



254 4 



2592 



850 



855 860 



eaa aga atg aaa aag eta ttt tgg gaa gat gtt ccg aac ccc aag aat 
Gin Arg Met Lys Lys Leu Phe Trp Glu Asp Val Pro Asn Pro Lys Asn 



2640 



865 



870 



tgt tec egg gca eaa gga ctt aat ttt cag aag aga acg gac att ett 
Cvs Ser Trp Ala Gin Gly Leu Asn Phe Gin Lys Arg Thr Asp He Leu 
Y 885 890 * 895 



2688 



«• * 



2691 



tga 



<210> 10 ' - - - 

<211> 896 
<212> PRT 

<213> Homo sapiens " 

<400> 10 . , . _ 

Met He Cys Gin Lys Phe Cys Val Val Leu Leu His Trp Glu Phe He 

1 5 10 15 

Tyr Val He Thr Ala Phe Asn Leu Ser Tyr Pro He Thr Pro Trp Arg 

20 25 3° 

Phe Lys Leu Ser Cys Met Pro Pro Asn Ser Thr Tyr Asp Tyr Phe Leu 

3 5 40 45 

Leu Pro Ala Gly Leu Ser Lys Asn Thr Ser Asn Ser Asn Gly His Tyr 

50. ' •-■ ' 55 60 

Glu Thr Ala' Val Glu Pro Lys Phe Asn Ser Ser Gly Thr His Phe Ser ' 



65 



70 



75 



Asn Leu Ser Lys Thr Thr- Phe His Cys Cys Phe Arg. Ser Glu Gin Asp 

85 90 95 

Arg Asn Cys Ser Leu Cys Ala Asp Asn He Glu Gly Lys Thr Phe Val 



100 



105 



110 



Ser Thr Val Asn Ser Leu Val Phe Gin Gin He Asp Ala Asn Trp Asn 



17 
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115 120 125 

He Gin Cys Trp Leu Lys Gly Asp Leu Lys Leu Phe' lie Gys Tyr Val 
130 13 5 '•' 140 

Glu Ser Leu Phe Lys Asn Leu Phe Arg Asn Tyr Asn Tyr Lys Val His 
145 150 155 160 

Leu Leu Tyr Val Leu Pro Glu Val Leu Glu Asp Ser Pro Leu Val Pro 

165 " 170 175 

Gin Lys Gly Ser Phe Gin Met Val "His Cys Asn Cys Ser Val His Glu • 

180 . 185 ' 190 

Cys Cys Glu Cys Leu Val Pro Val Pro Thr Ala Lys Leu Asn Asp Thr 
195 200 205 

Leu Leu Met Cys Leu Lys He Thr Ser Gly Gly Val lie Phe Gin Ser 
210 215 * 220 

Pro Leu Met Ser Val Gin Pro He Asn Met Val Lys Pro Asp Pro Pro 
225 230 235 240 

Leu Gly Leu His Met Glu He Thr Asp Asp Gly Asn Leu Lys He Ser 

245 250 255 

Trp Ser Ser Pro Pro Leu Val Pro Phe Pro Leu Gin Tyr Gin Val Lys 

260 265 270 

Tyr Ser Glu Asn Ser Thr Thr Val He Arg Glu Ala Asp Lys He Val 
275 280 285 

Ser Ala Thr Ser Leu Leu Val Asp Ser He Leu Pro Gly Ser ■ Ser- :Tyr 
290 295 300 

Glu Val Gin Val Arg Gly Lys Arg Leu Asp Gly Pro Gly He Trp Ser 
305 310 315 320 

Asp Trp Ser Thr Pro Arg Val Phe Thr Thr Gin Asp Val He Tyr Phe 

325 " 330 335 

Pro Pro Lys He Leu Thr Ser Val Gly Ser Asn- Val Ser Phe His Cys 

340 345 350 

He Tyr Lys Lys Glu Asn Lys He Val Pro Ser Lys Glu He Val Trp 
355 360 365 

Trp Met Asn Leu Ala Glu Lys He Pro Gin Ser Gin Tyr Asp Val Val 



18 
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370 



375 380 



Ser Asp His Val Ser Lys Val Thr Phe Phe Asn, Leu Asn Glu Thr Lys 

->or> 395 400 

385 390 

Pro Arg Gly Lys Phe Thr Tyr Asp Ala Val Tyr Cys Cys Asn Glu His 

405 410 415 

Glu Cys His His Arg Tyr Ala Glu Leu Tyr Val He Asp Val Asn He 

420 425 430 

Asn He Ser Cys Glu Thr Asp Gly Tyr Leu Thr Lys Met Thr Cys Arg 
435 .440 445 

Trp Ser Thr Ser Thr He Gin Ser Leu Ala Glu Ser Thr Leu Gin Leu 
450 455 460 

Arg Tyr His Arg Ser Ser Leu Tyr Cys Ser Asp He Pro Ser He His 
465 470 475 480 

Pro He Ser Glu Pro Lys Asp Cys Tyr Leu Gin Ser Asp Gly Phe Tyr 

485 490 495 

Glu Cys He Phe Gin Pro He Phe Leu Leu Ser Gly. Tyr Thr Met Trp 

500 ' 505 510 

lie Arg He Asn His Ser Leu Gly Ser Leu Asp Ser Pro Pro Thr Cys 
515 520 525 

Val Leu Pro Asp Ser, Val Val Lys Pro Leu Pro Pro Ser Ser Val Lys 
530 535 540 

Ala Glu He Thr He Asn He Gly Leu' Leu Lys He Ser Trp Glu Lys 
545 550 . 555 560 

Pro Val Phe Pro Glu Asn Asn Leu Gin Phe Gin He Arg Tyr Gly Leu 

,,565 570 575 

* ' '' ' " 

Ser Gly Lys Glu Val Gin Trp -Lys Met Tyr Glu Val Tyr Asp Ala Lys 

580'.. 585 590 

Ser Lys Ser Val Ser Leu Pro Val Pro Asp Leu Cys Ala Val Tyr Ala 
595 600 605 

Val Gin Val Arg Cys Lys Arg Leu Asp Gly Leu Gly Tyr Trp Ser Asn 
610 615 620 

Trp Ser Asn Pro Ala Tyr Thr Val Val Met Asp He Lys Val. Pro Met 
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£^ 640 
625 630 635 

Arg Gly Pro Glu Phe Trp Arg lie lie Asn Gly Asp Thr Met Lys Lys 

645 650 655 

Glu Lys Asn Val Thr Leu Leu Trp Lys Pro Leu Met Lys Asn Asp Ser 

660 665 670 

Leu Cys Ser Val Gin Arg Tyr Val He Asn His His Thr Ser Cys Asn 
675 680 685 

Gly Thr Trp Ser Glu Asp Val Gly Asn His Thr Lys Phe Thr Phe Leu 
690 695 700 

Trp Thr Glu Gin Ala His Thr Val Thr Val Leu Ala He Asn Ser He ■ 

Tin 715 720 

705 710 

Gly Ala Ser Val. Ala Asn Phe Asn Leu Thr Phe Ser Trp Pro Met Ser 

725 730 735 

Lys val Asn He Val Gin Ser Leu Ser Ala Tyr Pro Leu Asn Ser Ser 

740 745 750 

Cys Val He Val Ser Trp He Leu Ser Pro Ser Asp Tyr Lys Leu Met - 
755 . 760 765 

Tyr Phe He He Glu Trp Lys Asn Leu Asn Glu Asp Gly Glu He Lys 
770 775 780 

Trp Leu Arg He Ser Ser Ser Val Lys Lys Tyr Tyr He His Asp His 

., Qn 795 800 

785 790 '^^ 



Phe He Pro He Glu Lys Tyr Gin Phe Ser Leu Tyr Pro He Phe Met 

805 



810 815 



Glu Gly Val Gly Lys Pro Lys He He Asn Ser Phe Thr Gin Asp Asp 

820 825 830 

He Glu Lys His Gin Ser Asp Ala Gly Leu Tyr Val He Val Pro Val 
8 35 840 845 

He He Ser Ser Ser He Leu Leu Leu Gly Thr Leu Leu He Ser His 
850 855 860 • 

Gin Arg Met Lys Lys Leu Phe Trp Glu Asp Val Pro Asn Pro Lys Asn 
865 

Cys Ser Trp Ala Gin Gly Leu Asn Phe Gin Lys Arg Thr Asp He Leu 
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885 890 895 



<210> 11 
<211> 3705 
<212> ADN 

<213> Sequence artificielle 

<220> 

<221> CDS 

<222> (1) . • (3705) 



<223^ Description de la sequence artificielle : OBR LUC 

lZ 0 ltl\^ gcc-agc «=t acc acc age ate cac acc atg ctg etc ctg 
Met Val Leu Ala Ser Ser Thr Thr Ser lie His Thr Met Le, Leu Leu 



i 



5 10 



etc ctg atg etc ttc cac ctg gga etc caa get tea ate teg gcg cgc 
III Leu Met Leu Phe His Leu Gly Leu Gin Ala Se r Xle Ser Ala Arg 



20 



eag gag cag aag ctt ate teg gag gag gac ctg aeg cgt tat cca att 
IZ Oil Gil Lys Leu Xle Ser Glu Glu Asp Leu Thr Arg Tyr Pro He 



35 



„„ tta tct tqc atg cca cca aat tea acc tat 
act cct tgg aga ttt aag ttg ccc 

, _ -y - dor rvq Met Pro Pro Asn Ser Thr lyr 
Thr Pro Trp Arg Phe Lys Leu Ser Cys wee 



50 



.ac tac ttc ctt ttg cct get gga etc tea aag aat act tea aat teg 
gac tac ttc etc eg ^ Ser 

Asp Tyr Phe Leu Leu Pro Ala Gly Leu ber uy* ^ 



65 



70 



,at gga cat tat gag aca get gtt gaa cot aag ttt a,t tea agt ggt 
» £y His Tyr Glu Tar ,1. V.l Glu Pro Lys Phe »sn Ser Ser Gly 



85 90 



act cac ttt tct aac tta tec aaa aca act ttc cac tgt tgc ttt egg 
^r Z Phe Ser Asn Leu Ser Lys Thr Thr Phe His Cys Cys Phe Arg 



100 105 



48 



96 



144 



192 



240 



2 88 



336 



agt gag caa gat aga aac tgc tee tta tgt gea gac aac att gaa gga 
sL Glu Gin Asp Arg Asn Cys Ser Leu Cys Ala Asp Asn Xle Glu Gly 
115 120 



384 



21 
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acg aca ttt gtt tea aca gta aat tct tta gtt ttt caa caa ata gat . 432 
Thr Thr Phe Val Ser Thr Val Asn Ser Leu Val Phe Gin Gin He Asp 
130 135 140 



gca aac tgg aac ata cag tgc tgg eta aaa gga gac tta aaa tta ttc 
Ala Asn Trp Asn He Gin Cys Trp Leu Lys Gly Asp Leu Lys Leu Phe 
145 150 155 160 

ate tgt tat gtg gag tea tta ttt aag aat eta ttc agg aat tat aac 
He Cys Tyr Val Glu Ser Leu Phe Lys Asn Leu Phe -Arg Asn Tyr Asn 

165 170 175 

tat aag gtc cat ctt tta tat gtt ctg cct gaa gtg tta gaa gat tea 
Tyr Lys Val His Leu Leu Tyr Val Leu Pro Glu Val Leu Glu Asp Ser 

180 185 190 

cct ctg gtt ccc caa aaa ggc agt ttt cag atg gtt cac tgc aat tgc 
Pro Leu Val Pro Gin Lys Gly Ser Phe Gin Met Val His Cys Asn Cys 
195 200 205 

agt gtt cat gaa tgt tgt gaa tgt ctt gtg cct gtg cca aca gee aaa 
Ser Val His Glu Cys Cys Glu Cys Leu Val Pro Val Pro Thr Ala Lys 
210 215 220 

etc aac gac act etc ctt atg tgt ttg aaa ate aca tct ggt gga gta 
Leu Asn Asp Thr Leu Leu Met Cys Leu Lys He Thr Ser Gly Gly Val 
225 230 235 240 

att ttc egg tea cct eta atg tea gtt cag ccc ata aat atg gtg aag 
He Phe Arg Ser Pro Leu Met Ser Val Gin Pro lie Asn Met Val Lys 

245 250 255 

* * „ 

cct gat cca cca tta ggt ttg cat atg gaa ate aca gat gat ggt aat 
Pro Asp Pro Pro Leu Gly Leu His Met Glu He Thr Asp Asp Gly Asn 

260 265 270 

tta aag att tct tgg tec age cca cca ttg gta cca ttt cca ctt caa 
Leu Lys He Ser Trp Ser Ser Pro Pro Leu Val Pro Phe Pro Leu Gin 
275 280 285 

tat caa gtg aaa tat tea gag aat tct aca aca gtt ate aga gaa get 
Tyr Gin Val Lys Tyr Ser Glu Asn Ser Thr Thr Val He Arg Glu Ala 
290 295 300 

gac aag att gtc tea get aca tec ctg eta gta gac agt ata ctt cct 
Asp Lys He Val Ser Ala Thr Ser Leu Leu Val Asp Ser lie Leu Pro 
305 310 315- 320 



480 



528 



576 



624 



672 



720 



768 



816 



864 



912 



960 



22 
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ggg tct teg tat gag gtt cag gtg agg ggc aag aga ctg gat ggc oca 
Gly Ser Ser Tyr Glu Val Gin Val Arg Gly Lys Arg Leu Asp Gly Pro 



1008 



325 



gga ate tgg agt gac tgg agt act cct cgt gtc ttt acc aca caa gat 
tly lie Trp Ser Asp Trp Ser Thr Pro Arg Val Phe Thr Thr Gin Asp 



1056 



340 



ate ata tac ttt cca cct aaa att ctg aca agt gtt ggg tct aat gtt 
Val He Tyr Phe Pro " Pro Lys He Leu Thr Ser Val Gly Ser Asn Val 



1104 



355 



3 60 365 



tct ttt cac tgc ate tat aag aag gaa aacaag att gtt ccc tea aaa 
Ser Phe His Cys He Tyr Lys Lys Glu Asn Lys lie Val Pro Ser Lys 
370 



1152 



375 380 



gag att gtt tgg tgg atg aat tta get gag aaa att cct caa age cag 
Glu He Val Trp Trp Met Asn Leu Ala Glu Lys. He Pro Gin Ser Gin 
385 . 390 395 400 

tat gat gtt gtg agt gat cat gtt age aaa gtt act ttt ttc aat ctg 
^yr Asp Val Val Ser Asp His Val Ser Lys Val . Thr Phe Phe Asn Leu 

405 410 415 

aat gaa acc aaa cct cga gga aag ttt acc tat gat gca gtg tac tgc 
Asn Glu Thr Lys Pro Arg Gly Lys Phe Thr Tyr Asp Ala Val Tyr Cys 

a ^ r> 



1200 



1248 



1296 



420 



425 430 



tgc aat gaa cat gaa tgc cat cat cgc tat get gaa tta tat gtg att 
Cys Asn Glu His Glu Cys His His Arg Tyr Ala Glu Leu Tyr Val He 
43 5 



1344 



440 445 



gat gtc aat ate aat ate tea tgt gaa act gat- ggg tac tta act aaa 
Asp Val Asn Tie Asn He Ser Cys Glu Thr Asp Gly Tyr Leu Thr Lys 



1392 



450 



455 460 



atg act tgc aga tgg tea acc agt aca ate cag tea ctt gcg gaa age 
Met Thr Cys Arg Trp Ser Thr Ser Thr He Gin Ser Leu, Ala Glu Ser 
465 470 475 480 

act ttg caa ttg agg tat cat agg age age ctt tac tgt tct gat att 
Thr Leu Gin Leu Arg Tyr His Arg Ser Ser Leu Tyr Cys Ser Asp He 

485 490 495 

cca tct att cat ccc ata tct gag ccc aaa gat tgc tat ttg cag agt 
Pro Ser He His Pro He Ser Glu Pro Lys Asp Cys Tyr Leu Gin Ser 

500 505 . 510 



1440 



1488 



1536 
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gat ggt ttt tat gaa tgc att ttccag cca ate ttc eta tta tot ggc 
Lp Gly Phe Tyr Glu Cys He Phe Gin Pro He Phe Leu ;Leu Ser Gly 



515 



520 525 



tac aca atg tgg att agg ate aat eae tot eta ggt tea ctt gae tet 
Tyr Thr Met Trp He Arg He Asn His Ser Leu Gly Ser Leu Asp Ser 

535 ■ 540 



530 



eea eea aea tgt gte ett pet gat tet gtg gtg aag eea etg cct cca 
Pro Pro Thr Cys Val Leu Pro Asp Ser Val Val Lys Pro Leu Pro Pro 
545 550 555 • 

tee agt gtg aaa gea gaa att aet ata aae att gga tta ttg aaa ata 
Ser Ser Val Lys Ala Glu He Thr He Asn He Gly Leu Leu Lys He 



565 



570 575 



tet tgg gaa aag cca gte ttt eea gag aat aae ctt caattc eag att 
Ser Trp Glu Lys Pro Val Phe Pro Glu Asn Asn Leu Gin Phe Gin lie 



580 



585 590 



cgc tat ggt tta agt gga aaa gaa gta caa tgg aag atg tat gag gtt 
Arg Tyr Gly Leu Ser Gly Lys Glu Val Gin Trp Lys Met Tyr Glu Val 



595 



600 605 



tat gat gca aaa tea aaa tet gte agt etc cca gtt cca gae ttg tgt 
Tyr Asp Ala Lys Ser Lys Ser Val Ser Leu Pro Val Pro Asp Leu Cys 
610 615 620 

gca gte tat get gtt cag gtg cgc tgt aag agg eta gat gga etg gga 
Ala Val Tyr Ala Val Gin Val Arg Cys Lys Arg Leu Asp Gly Leu Gly 



625 



630 635 



tat tgg agt aat tgg age aat cca gee tac aea gtt gte atg gat ata 
Tyr Trp Ser Asn Trp Ser Asn Pro Ala Tyr Thr Val Val Met Asp He 



1584 



645 650 655 



1632 



aaa gtt eet atg aga gga cct gaa ttt tgg aga ata att aat gga gat 
Lys Val Pro Met Arg Gly Pro Glu Phe Trp Arg He He - Asn Gly Asp 

660 665 670 

aet atg aaa aag gag aaa aat gte act tta ctt tgg aag cce etg atg 
Thr Met Lys Lys Glu Lys Asn Val Thr Leu Leu Trp Lys Pro Leu Met 



1580 



675 



680 685 



aaa aat gae tea ttg tgc agt gtt cag aga tat gtg ata aac cat cat 
L ys Asn Asp Ser Leu Cys Ser Val Gin Arg Tyr Val He Asn Hxs Hxs 



1728 



1776 



1824 



1872 



1920 



1968 



2016 



2064 



2112 



_ 700 
690 byb 



24 
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act tec tgc aat gga aca tgg' tea -gaa gat gtg gga aat cac acg aaa 
act tec tgc _ - . ger Glu Asp V al Gly Asn. His Thr Lys 

Thr Ser Cys Asn Gly Tftr up s« ^ . 

705 

ttc act ttc ctg tgg aca gag caa gca cat act gtt acg gtt ctg gec 
L Thr Phe Leu Trp Thr Glu Gin Ma His Thr. Val Thr Val eu Ala 



2160 



725 



730 



ate aat tea att ggt get tct gtt gca aat ttt aat tta aec. ttt tea 
lie Asn Ser He Gly Ala Ser Val Ala Asn Phe Asn Leu Thr Phe Ser. 



740 



745 750 



tgg cet atg age aaa gta aat ate gtg eag tea etc agt get tat eet 
Trp Pro Met Ser Lys Val Asn He Val Gin Ser Leu Ser Ala Tyr Pro - 



755 



760 765 



tta aae age agt tgt gtg att gtt tec tgg ata eta tea cec agt gat 
L eu Asn Ser Ser Cys Val' He Val Ser Trp He Leu Ser Pro Ser Asp 

*"7 O A 



770 



775 780 



tac aag eta atg tat ttt att att gag tgg. aaa aat ett aat gaa gat 
Tyr Lys Leu Met Tyr Phe He He Glu Trp Lys Asn Leu Asn Glu Asp 

. 795 

ggt gaa ata aaa tgg ctt aga ate tct tea tet gtt aag aag tat tat 

*v-~ ti 0 q^r- Ser Ser Val Lys Lys Tyr Tyr 
Gly Glu He Lys Trp Leu Arg He Ser ber ber vax y . 

805 810 815 

ate cat gat cat ttt ate eee att gag aag tac cag ttc agt ett tac 
Xi e His Lp His Phe He Pro lie Glu Lys Tyr Gin Phe Ser Leu Tyr 

820 825 830 

oca ata ttt atg gaa gga gtg gga aaa eea aag ata att aat agt ttc 
Pro He Phe Met Glu Gly Val Gly Lys Pro Lys He He Asn Ser Phe 

845 



2208 



83 5 



840 



act caa ' gat gat att gaa aaa cac cag agt gat gca ggt tta tat gta 
Thr Gin Asp Asp He Glu Lys His Gin Ser Asp Ala Gly Leu Tyr Val 



2256 



2304 



850 



855 860 



att atg cca gta att att tee tct tec ate tta ttg ctt gga aca tta 
xfe Val Pro Val He He Ser Ser Ser He Leu Leu Leu Gly Thr Leu 



865 



870 875 



tta ata tea cac caa aga atg aaa aag eta ttt tgg gaa gat gtt ccg 
L eu lie Ser His Gin Arg Met Lys Lys Leu Phe Trp Glu Asp Val Pro 

885 890 895 



2352 



2400 



2448 



2496 



2544 



2592 



2640 



2688 
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aac ccc aa g aat tgt tec tgg gca caa gga ctt «t «t cag aag a,a 
A sn Pro Lys Asn Cys Ser Trp Ala' Gin Gly Leu Asn Phe Gin Lys Arg 

900 905 9 

acg gac att" ctg gat oca cog get aga gec acc atg acc agp aag gtg 
T hr Lp He Leu Asp Pro Pro Ala Arg Ala Thr Met Thr Ser Lys Val 
915 92° 92 

tac gac ccc gag cag agg aag agg atg ate acc ggc ccc cag tgg tgg 
T yr Asp Pro Glu Gin Arg Lys Arg Met He Thr Gly Pro Gin Trp Trp 
930 

gec agg tgc aag cag atg aac gtg ctg gac age ttc ate aac tac tac 
Ala Arg Cys Lys Gin Met Asn Val Leu Asp Ser Phe lie Asn Tyr Tyr 



2736 



2784 



2832 



2880 



945 



950 



955 



g .= M c „„ aa S c,= fl co g a a aac 3 cc ,« «= «o of eac g 3 = «<, 2928 
MP ser Glu Lys His »1. Glu Asn Ala val lie Phe Leu His Gly 

970 y 7 3 



965 



gec get age age tac ctg tgg agg cae gtg gtg ccc cac ate gag ccc 
Ma Ala Ser Ser Tyr Leu Trp Arg His Val Val Pro Hrs lie Glu Pro 

■ - 9 y u 



2976 



980 



985 



3072 



3120 



gtg gee agg tgc ate ate ccc gat ctg ate ggc atg ggc aag age ggc 3024 
Val Ala Arg Cys He He Pro Asp Leu He Gly Met Gly Lys Ser Gly 
995 1000 1005 

>-~~ *r,r< r-ra rta aac cac tac aag tac ctg 
,=,rr f*ni- aac aac ggc age tac agg erg cty 

Z Ser Gly Asn Sly Ser Tyr Arg Leu Leu Asp His Tyr Lys 
1010 

acc gec tgg ttc gag etc ctg aac ctg ccc aag aag ate ate ttc gtg 
Thr Ala Trp Phe ' Glu Leu Leu Asn Leu Pro Lys Lys He He Phe Va^ 
1025 1030 1035 

ggc cac gac tgg ggc gee tgc ctg gec ttc cac tac age tac gag cac 
lly His Asp Trp Gly Ala Cys Leu Ala Phe His Tyr Ser Tyr Glu 

1045 105° 1055 

eag gac aag ate aag gec ate gtg cac gec gag age gtg gtg gac gtg 
Gin Asp Lys He Lys Ala He Val His Ala Glu Ser Val Val Asp Val 

1060 1065 

ate gag age tgg gac gag tgg cca gac ate gag gag gac ate gee ctg 
He Glu Ser Trp Asp Glu Trp Pro Asp He Glu Glu Asp 
1075 1080 1085 

26 



3168 



3216 



3264 
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ate aag age gag gag ggc gag aag atg gtg ctg gag aac aac ttc ttc 3312 
He Lys Ser Glu Glu Gly Glu Lys Met Val Leu Glu Asn Asn Phe Phe 
1090 1095 HOO 



gtg gag ace atg ctg ccc age aag ate atg aga aag ctg gag ccc gag 
Val Glu Thr Met Leu Pro Ser Lys He Met Arg Lys Leu Glu Pro Glu 
1105 H10 • 1H5 H20 

gag ttc gec gec tac ctg gag ccc ttc aag gag aag ggc gag gtg aga 
Glu Phe Ala Ala Tyr Leu Glu Pro Phe Lys Glu Lys Gly Glu Val Arg 

1125 - H30 7 H35 

aga ccc acc ctg age tgg ccc aga gag ate ccc ctg gtg aag ggc ggc 
Arg Pro Thr Leu Ser Trp Pro Arg Glu He Pro Leu Val Lys Gly Gly 

1140 1145 1150 

aag ccc gac gtg* gtg cag ate gtg aga aac tac aac gee tac ctg aga 
Lys Pro Asp Val Val Gin lie Val Arg Asn Tyr Asn Ala Tyr Leu Arg 
1155 1160 1165 



gag cag taa 
Glu Gin 

1235 



3360 



3408 



3456 



3504 



3705 



V 



gec age gac gac ctg ccc aag atg ttc ate gag age gac ccc ggc ttc 3 552 
Ala Ser Asp Asp Leu Pro Lys Met Phe He Glu Ser Asp Pro Gly Phe 
1170 1175 1180 

ttc age aac gec ate gtg gag ggc gee aag aag ttc ccc aac acc gag 3600 * 
Phe Ser Asn Ala He Val Glu Gly Ala Lys Lys Phe Pro Asn Thr Glu 
1185 H90 1195 1200 

ttc gtg aag gtg aag ggc ctg cac ttc age cag gag gac gee ccc gac 3648 
Phe Val Lys Val Lys Gly Leu His Phe Ser Gin Glu Asp Ala Pro Asp 

1205 1210 . 1215 

gag atg ggc aag tac ate aag age ttc gtg gag aga gtg ctg aag aac 3 696 
Glu Met Gly Lys Tyr lie Lys Ser Phe Val Glu Arg Val Leu Lys Asn 

1220 1225 1230 



<210> 12 
<211> 1234 
<212> PRT 

<213> Sequence artificielle 

<223> Description de la sequence artificielle : OBR LUC 
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<400> 12 

Met Val Leu Ala Ser Ser Thr Thr Ser He His Thr Met Leu Leu Leu 
1 5 10 15 

Leu Leu Met Leu Phe His Leu Gly Leu Gin Ala Ser' lie Ser Ala Arg 

20 "25 30 

Gin Glu Gin Lys Leu He Ser Glu Glu Asp Leu Thr Arg Tyr Pro He 

35 40 45 

Thr Pro Trp Arg Phe Lys Leu Ser Cys Met Pro Pro Asn Ser Thr Tyr 
50 55 60 

Asp Tyr Phe Leu Leu Pro Ala Gly Leu Ser Lys Asn Thr -Ser Asn Ser 

nn 75 80 

65 70 

Asn Gly His Tyr Glu Thr. Ala Val Glu Pro Lys Phe Asn Ser Ser Gly 

85 90 95 

Thr His Phe Ser Asn Leu Ser Lys Thr Thr Phe His Cys Cys Phe Arg 

100 105 HO 

Ser Glu Gin Asp Arg Asn Cys Ser Leu Cys Ala Asp Asn He Glu Gly 
115 120 125 

Thr Thr Phe Val Ser Thr Val Asn Ser Leu Val Phe Gin Gin He Asp 
130 135 140 

Ala Asn Trp Asn He Gin Cys Trp Leu Lys Gly Asp Leu Lys Leu Phe 
145 150 155 16° 

He Cys Tyr Val Glu Ser Leu Phe Lys Asn Leu Phe Arg Asn Tyr Asn 

165 170 I 75 

Tyr Lys Val His Leu^Leu Tyr Val Leu Pro Glu Val Leu Glu Asp Ser 

180 185 190 

Pro Leu Val Pro Gin Lys Gly Ser Phe Gin Met Val His Cys Asn Cys 
195 200 205 

Ser Val His Glu Cys Cys Glu Cys Leu Val Pro Val Pro Thr Ala Lys 
210 215 220 

Leu Asn Asp Thr Leu Leu Met Cys Leu Lys lie Thr Ser Gly Gly Val 

230 235 

He Phe Arg Ser Pro Leu. Met Ser Val Gin Pro He Asn Met Val Lys 

245 250 255 

28 
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Pro Asp Pro Pro Leu Gly Leu "His-. Met Glu He. Thr Asp Asp Gly Asn 

260 



265 270 



Leu Lys He Ser Trp Ser Ser Pro Pro Leu Val Pro Phe Pro Leu Gin 
275 



280 . 286 



Tyr Gin Val Lys Tyr Ser Glu Asn Ser Thr Thr Val He Arg Glu Ala 
290 295 300 

Asp Lys He Val Ser Ala Thr Ser Leu Leu Val Asp Ser lie Leu Pro 
305 310 315 • 320 

Gly Ser Ser Tyr Glu Val Gin Val Arg Gly Lys Arg Leu Asp Gly Pro 

325 330 " 335 

Gly He Trp Ser Asp Trp Ser Thr Pro Arg Val Phe Thr Thr Gin Asp 

340 345 350 

Val He Tyr Phe Pro Pro Lys He Leu Thr Ser Val Gly Ser Asn Val 
355 360 365 

Ser Phe His Cys -lie' Tyr Lys Lys Glu Asn Lys He Val Pro Ser Lys 
370 375 380 . 

Glu He Val Trp Trp Met .Asn Leu Ala Glu Lys He Pro Gin Ser Gin 

-,an 395 400 

385 390 

Tyr Asp Val Val Ser Asp His Val Ser Lys Val Thr Phe Phe Asn Leu 

405 410 415 

Asn Glu Thr Lys Pro Arg Gly Lys Phe Thr Tyr Asp Ala Val Tyr Cys 

420 425' 430 

Cys Asn Glu His Glu Cys His His Arg Tyr Ala Glu Leu Tyr Val He 
435 440 445 

Asp Val Asn He Ash lie Ser Cys Glu Thr Asp Gly Tyr Leu Thr Lys 
450 455 460 

Met Thr Cys Arg Trp Ser Thr Ser Thr He Gin Ser Leu Ala Glu Ser 

/nn 475 480 

465 470 'a' 3 

Thr Leu Gin Leu Arg Tyr His Arg Ser Ser Leu Tyr Cys Ser Asp He 

485 490 495 

Pro Ser He His Pro He Ser Glu Pro Lys Asp Cys Tyr Leu Gin Ser 

500 505 510 
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Asp Gly Phe Tyr Glu Cys He Phe Gin Pro He Phe Leu Leu Ser Gly 
515 



520 525 



Tyr Thr Met Trp He Arg lie Asn His Ser Leu Gly Ser Leu Asp Ser 
530 535 540 

Pro Pro Thr Cys Val Leu Pro Asp Ser Val Val Lys Pro Leu Pro Pro 
54 5 550 555 560 

Ser Ser Val Lys Ala Glu He Thr He Asn He Gly Leu Leu Lys He 

565 570 575 

Ser Trp Glu Lys Pro Val Phe Pro Glu Asn Asn Leu Gin Phe Gin He 

580 585 590 

Arg Tyr Gly Leu Ser Gly Lys Glu Val Gin Trp Lys Met Tyr Glu Val 
595 600 605 

Tyr Asp Ala Lys Ser Lys Ser Val Ser Leu Pro Val Pro Asp Leu Cys 
6io 615 620 

Ala Val Tyr Ala Val Gin Val Arg Cys Lys Arg Leu Asp Gly Leu Gly 
625 630 635 640 

Tyr Trp Ser Asn Trp Ser Asn Pro Ala Tyr Thr Val Val Met Asp He 

645 650 655 

Lys Val Pro Met Arg Gly Pro Glu Phe Trp Arg He He Asn Gly Asp 

660 665 670 

Thr Met Lys Lys Glu Lys Asn Val Thr Leu Leu Trp Lys Pro Leu Met 
675 680 685 

Lys Asn Asp Ser Leu Cys Ser Val Gin Arg Tyr Val He Asn His His 
690 695 700 

Thr Ser Cys Asn Gly Thr Trp Ser Glu Asp Val Gly Asn His Thr Lys 

-it n 71 S 720 

705 710 

Phe Thr Phe Leu Trp Thr Glu Gin Ala His Thr Val Thr Val Leu Ala 

725 7 30 735 

He Asn Ser He Gly Ala Ser Val Ala Asn Phe Asn Leu Thr Phe Ser 

740 7 45 7 50 

Trp Pro Met Ser Lys Val Asn He Val Gin Ser Leu Ser Ala Tyr Pro 
755 760 7 65 ' 



30 
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Leu Asn Ser Ser Cys Val He Val Ser Trp lie Leu Ser Pro Ser Asp 
770 775 . 780 

Tyr Lys Leu Met Tyr Phe He He Glu Trp Lys Asn Leu Asn Glu Asp 
785 . 790 795 800 

Gly Glu He Lys Trp Leu Arg He Ser Ser Ser Val Lys Lys Tyr Tyr 

805 810 815 

lie His Asp His Phe He -Pro He Glu Lys Tyr Gin Phe Ser Leu Tyr 

820 825 .. 830 • - 

Pro He Phe Met Glu Gly Val Gly Lys Pro Lys He lie Asn Ser Phe 
835 840 845 ' 

Thr Gin Asp Asp He Glu Lys His Gin Ser Asp Ala Gly Leu Tyr Val 
850 855 . 860 

He Val Pro Val He He Ser Ser Ser He Leu Leu Leu Gly Thr Leu 

865 870 875 ' 880 •- 

Leu He Ser His Gin Arg Met Lys Lys Leu Phe Trp Glu Asp Val Pro , 

885 890 895 

Asn Pro Lys Asn Cys Ser Trp Ala Gin Gly Leu Asn Phe Gin Lys Arg ^ 

900 905 910 N 

Thr Asp He Leu Asp Pro Pro Ala Arg Ala Thr Met Thr Ser Lys Val . 
915 920 925 

Tyr Asp Pro Glu Gin Arg Lys Arg Met He Thr Gly Pro Gin Trp Trp 
930 935 * 940 

Ala Arg Cys Lys Gin Met Asn Val Leu Asp Ser Phe He Asn Tyr Tyr 
945 950 955 960 

Asp Ser Glu Lys. His Ala Glu Asn Ala Val He Phe Leu His Gly Asn 

965 970 975 

Ala Ala Ser Ser Tyr Leu Trp Arg His Val Val Pro His He Glu Pro 

980 985 " 990 

Val Ala Arg Cys He He Pro Asp Leu He Gly Met Gly Lys Ser Gly 
995 1000 1005 

Lys Ser Gly Asn Gly Ser Tyr Arg Leu Leu Asp His Tyr Lys Tyr Leu 
1010 1015 1020 
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Thr Ala Trp Phe Glu Leu Leu Asn Leu Pro Lys Lys lie lie Phe Val 

-imn 1035 1040 

025 1030 

Glv His Asp Trp Gly Ala Cys Leu Ala Phe His Tyr Ser Tyr Glu His 

1045 1050 1055 

Gin Asp Lys lie Lys Ala He Val His Ala Glu Ser Val Val Asp Val 

1060 1065 1070 

He Glu Ser Trp Asp Glu Trp Pro Asp He Glu Glu Asp lie Ala Leu 
1075 1° 80 1085 

He Lys Ser Glu Glu Gly Glu Lys Met Val Leu Glu Asn Asn Phe Phe 
1090 1° 95 1100 

Val Glu Thr Met Leu Pro Ser Lys He Met Arg Lys Leu Glu Pro Glu 

1 i i n 1115 1120 
105 .. H10 

Glu Phe Ala Ala Tyr Leu Glu Pro Phe Lys Glu Lys Gly Glu Val Arg 

1125 H30 II 35 

Arg Pro Thr Leu Ser Trp Pro Arg Glu He Pro Leu Val Lys Gly Gly 

1140 H45 H50 

Lys Pro Asp Val Val Gin He Val Arg Asn Tyr Asn Ala Tyr Leu Arg 
1 155 1160 H65 

Ala Ser Asp Asp Leu Pro Lys Met Phe He Glu Ser Asp Pro Gly Phe 
1170 H75 H 80 

Phe Ser Asn Ala He Val Glu Gly Ala Lys Lys Phe Pro Asn Thr Glu 
185 1190 H95 "CO 

Phe Val Lys Val Lys Gly Leu His Phe Ser Gin Glu Asp Ala Pro Asp 

1205 1210 I 23 - 5 

Glu Met Gly Lys Tyr He Lys Ser Phe Val Glu Arg Val Leu Lys Asn 

1220 1225 1230 

Glu Gin 



<210> 13 
<211> 3486 

s 

<212> ADN 

<213> Sequence artif icielle 
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48 



96 



144 



<220> ' . 

<221> CDS 
<222> (1)..(3486) 

<220> 

<223> Description de la sequence artif icielle : OBR YFP 

atg°gtt ctt gcc age tct acc acc age ate cac acc atg ctg etc ctg 
Met Val Leu Ala Ser Ser Thr Thr. Ser He His Thr Met Leu Leu Leu 
1 5 .10 15 

etc ctg atg etc ttc cac ctg gga etc caa get tea ate teg gcg cgc 
Leu Leu Met Leu Phe His Leu Gly Leu Gin Ala Ser He Ser Ala Arg 

20 25- 30 

cag gag cag aag ctt ate teg gag gag gac ctg acg cgt tat cca att 
Gin Glu Gin Lys Leu He Ser Glu Glu Asp Leu Thr Arg Tyr Pro He 

35 .40 45 

act cct tgg aga ttt aag ttg tct tgc atg cca cca aat tea acc tat 
Thr Pro Trp Arg Phe Lys Leu Ser Cys Met Pro Pro Asn Ser Thr Tyr 

50 55 ' . 60 

gac tac ttc ctt ttg cct get gga etc tea aag aat act tea aat teg 
Asp Tyr Phe Leu Leu Pro Ala Gly Leu Ser Lys Asn Thr Ser Asn Ser 

nr\ 75 80 

65 70 

aat gga cat tat gag aca get gtt gaa cct aag ttt aat tea agt ggt 
Asn Gly His Tyr Glu Thr Ala Val Glu Pro Lys Phe Asn Ser Ser Gly 

' 85 . 90 95 

> 

act cac ttt tct aac tta tec aaa aca act ttc eac tgt tgc ttt egg 336 

Thr His Phe Ser Asn Leu Ser Lys Thr Thr Phe His Cys Cys Phe Arg 

' 100 105 110 



192 



•f 



240 



288 



agt gag caa gat aga aac tgc tec tta tgt gca gac aac att gaa gga 
Ser Glu Gin Asp Arg Asn Cys Ser Leu Cys Ala Asp Asn He Glu Gly . 
115 120 125 

acg aca ttt gtt tea aca gta aat tct tta gtt ttt caa caa ata gat 
Thr Thr Phe Val Ser Thr Val Asn Ser Leu Val Phe Gin Gin He Asp 
130 135 I 40 

gca aac tgg aac ata cag tgc tgg eta aaa gga gac tta aaa tta ttc 
Ala Asn Trp Asn He Gin Cys Trp Leu Lys Gly Asp Leu Lys Leu Phe 
145 150 155 160 



384 



432 



480 
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ate tgt tat gtg gag tea tta ttt aag aat eta ttc agg aat tat: aac 
He Cys Tyr Val Glu Ser Leu Phe Lys Asn Leu Phe Arg Asn Tyr Asn 

165 170 -* ■ 175 

tat aag gtc cat ctt tta tat gtt ctg cct gaa gtg -tta'gaa gat tea 
Tyr Lys Val His Leu Leu Tyr Val Leu Pro Glu Val Leu Glu Asp Ser 

180 185 190 

cct ctg gtt ccc caa aaa ggc agt ttt cag atg gtt cac tgc aat tgc 
Pro Leu Val Pro Gin Lys Gly Ser Phe Gin Met Val His Cys Asn Cys 
195 200 205 

agt gtt cat gaa tgt tgt gaa tgt ctt gtg ccf gtg cca aca gee aaa 
Ser Val His Glu Cys Cys Glu Cys Leu Val Pro Val Pro Thr Ala Lys 
210 215 220 

etc aac gac act etc ctt atg tgt ttg aaa ate aca tct ggt gga gta 
Leu Asn Asp Thr Leu Leu Met Cys Leu Lys He Thr Ser Gly Gly Val 
225 230 235 240 

att ttc egg tea cct eta atg tea gtt cag ccc ata aat atg gtg aag 
lie Phe Arg Ser Pro Leu Met Ser Val Gin Pro He Asn Met Val Lys 

245 250 255 

cct gat cca cca tta ggt ttg cat atg gaa ate aca gat gat ggt aat 
Pro Asp Pro Pro Leu Gly Leu His Met Glu He Thr Asp Asp Gly Asn 

260 265 270 

tta aag att tct tgg tec age cca cca ttg gta cca ttt cca ctt caa 
Leu Lys He Ser Trp Ser Ser Pro Pro Leu Val Pro Phe Pro Leu Gin 
275 280 285 

tat caa gtg aaa tat tea gag aat tct aca aca gtt ate aga gaa get 
Tyr Gin Val Lys Tyr Ser Glu Asn Ser Thr Thr Val He Arg Glu Ala 
290 295 300 

gac aag att gtc tea get aca tec ctg eta gta gac agt ata ctt cct 
Asp Lys He Val Ser Ala Thr Ser Leu Leu Val Asp Ser He Leu Pro 
305 310 315 320 

ggg tct teg tat gag gtt cag gtg agg ggc aag aga ctg gat ggc cca 
Gly Ser Ser Tyr Glu Val Gin Val Arg Gly Lys Arg Leu Asp Gly Pro 

325 330 335 

gga ate tgg agt gac tgg agt act cct cgt gtc ttt ace aca caa gat 
Gly He Trp Ser Asp Trp Ser Thr Pro Arg Val Phe Thr Thr Gin Asp 

340 345 350 



528 



576 



624 



672 



720 



768 



816 



864 



912 



960 



1008 



1056 
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gtc ata tac ttt cca cct aaa att ctg aca'agt gtt ggg tct aat gtt 
Val lie Tyr Phe Pro Pro Lys lie Leu Thr Ser Val Gly Ser Asn Val 
355 360 . 365 

tct ttt. cac tgc ate tat aag aag gaa aac aag att gtt ccc tea aaa 
Ser Phe His Cys lie Tyr Lys Lys Glu Asn Lys lie Val Pro Ser Lys 
370 375 380 

gag att gtt tgg tgg atg aat tta get gag aaa att cct caa age cag 
Glu lie Val Trp Trp Met Asn Leu Ala Glu Lys lie Pro Gin Ser Gin 
385 390 395 400 

tat gat gtt gtg agt gat cat gtt age aaa gtt act ttt ttc aat ctg 
Tyr Asp Val Val Ser Asp His Val Ser Lys Val Thr Phe Phe Asn Leu 

405 410 415 

aat gaa ace aaa cct cga gga aag ttt acc tat gat gca gtg tac tgc 
Asn Glu Thr Lys Pro Arg Gly Lys Phe Thr Tyr Asp Ala Val Tyr Cys 

420 425 430 

tgc aat gaa cat gaa tgc cat cat cgc tat get gaa tta tat gtg att 
Cys Asn Glu His Glu Cys His His Arg Tyr Ala Glu Leu Tyr Val lie 
435 440 445 

gat gtc aat ate aat ate tea tgt gaa act gat ggg tac tta act aaa 
Asp Val Asn lie Asn lie Ser Cys Glu Thr Asp Gly Tyr Leu Thr Lys 
450 455 460 

atg act tgc aga tgg tea acc agt aca ate cag tea ctt gcg gaa age 
Met Thr Cys Arg Trp Ser Thr Ser Thr lie Gin Ser Leu Ala Glu Ser 
465 470 475 480 

act ttg caa ttg agg tat cat agg age age ctt tac tgt tct gat att 
Thr Leu Gin Leu Arg Tyr His Arg Ser Ser Leu Tyr Cys Ser Asp He 

485 490 495 

cca tct att cat ccc ata tct gag ccc aaa gat tgc tat ttg cag agt 
Pro Ser He -His Pro lie Ser Glu Pro Lys Asp Cys Tyr Leu Gin Ser 

500 505 510 

gat ggt ttt tat gaa tgc att ttc cag cca ate ttc eta tta tct ggc 
Asp Gly Phe Tyr Glu Cys He Phe Gin Pro He Phe Leu Leu Ser Gly 
515 520 525 



tac aca atg tgg att agg ate aat cac tct eta ggt tea ctt gac tct 
Tyr Thr Met Trp He Arg He Asn His Ser Leu Gly Ser Leu Asp Ser 
530 535 540 
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cca cca aca tgt gtc ctt cct gat tct gtg gtg aag cca ctg cct cca 
Pro Pro Thr Cys Val Leu Pro Asp Ser Val Val Lys Pro Leu Pro Pro 

ccn ' 555 560 

545 550 5S 

tec agt gtg aaa gca gaa att act ata aac aft gga tta ttg aaa ata 

Ser Ser Val Lys Ala Glu lie Thr lie Ash He Gly Leu Leu Lys He 

565 570 575 

tct tgg gaa aag cca gtc ttt cca gag aat aac ctt caa ttc cag att 
Ser Trp Glu Lys Pro Val Phe Pro Glu Asn Asn Leu Gin Phe Gin He 

580 585 590 

cgc tat ggt tta agt gga aaa gaa gta caa tgg aag atg. tat gag gtt 
Arg Tyr Gly Leu Ser Gly Lys Glu Val Gin Trp Lys Met Tyr Glu Val 
595 600 605 

tat gat gca aaa tea aaa tct gtc agt etc cca gtt cca gac ttg tgt 
Tyr Asp Ala Lys Ser Lys Ser Val Ser Leu Pro Val Pro Asp Leu Cys 
610 615 620 

gca gtc tat get gtt cag gtg cgc tgt aag agg eta gat gga ctg gga 
Ala Val Tyr Ala Val Gin Val Arg Cys Lys Arg Leu Asp Gly Leu Gly 

r -> r\ R 64 0 

625 630 

tat tgg agt aat tgg age aat cca gec tac aca gtt gtc atg gat ata 

Tyr Trp Ser Asn Trp Ser Asn Pro Ala Tyr Thr Val Val Met Asp He 

645 650 655 

aaa gtt cct atg aga gga cct gaa ttt tgg aga ata att aat gga gat 
Lys Val Pro Met Arg Gly Pro Glu Phe Trp Arg He He Asn Gly Asp 

660 665 670 

act atg aaa aag gag aaa aat gtc act tta ctt tgg aag ccc ctg atg 
Thr Met Lys Lys Glu Lys Asn Val Thr Leu Leu Trp Lys Pro Leu Met 
675 680 685 

aaa aat gac tea ttg tgc agt gtt cag aga tat gtg ata aac cat cat 
Lys Asn Asp Ser Leu Cys Ser Val Gin Arg Tyr Val He Asn His His 
690 695 700 

act tec tgc aat gga aca* tgg' tea gaa gat gtg gga aat cac acg aaa 
Thr Ser Cys Asn Gly Thr Trp Ser Glu Asp Val Gly Asn Hxs Thr Lys 

nin 715 720 

705 710 

ttc act ttc ctg tgg aca gag caa gca cat act gtt acg gtt ctg gec 
Phe Thr Phe Leu Trp Thr Glu Gin Ala His Thr Val Thr .Val Leu Ala 

725 ' 7 30 - 735 



1680 



1728 



1776 



1824 



1872 



1920 



1968 



2016 



2064 



2112 



2160 



2208 



36 



fp. 
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ate aat tea att ggt get tct gtt gea aat ttt aat tta aec ttt tea 
lie Asn Ser lie Gly Ala Ser. Val Ala Asn Phe Asn Leu Thr Phe Ser 

740 745 750 

tgg cct atg age aaa gta aat ate gtg cag tea ete agt get tat eet 
Trp Pro Met Ser Lys Val Asn lie Val Gin Ser Leu Ser Ala Tyr Pro 
755 760 765 

tta aae age agt tgt gtg att gtt tee tgg ata eta tea eee agt gat 
Leu Asn Ser Ser Cys Val He Val Ser. Trp lie Leu Ser Pro Ser Asp 
770 775 780 

tae aag eta atg tat" ttt att att gag tgg aaa aat. ctt aat gaa gat 
Tyr Lys Leu Met Tyr Phe He He Glu Trp Lys Asn Leu Asn Glu Asp 
785 790 795 800 

ggt gaa ata aaa tgg ett aga ate tct tea tet gtt aag aag tat tat 
Gly Glu lie Lys Trp Leu Arg He Ser Ser Ser Val Lys Lys Tyr Tyr 

805 810 815 

ate cat gat eat ttt ate ccc att gag aag tae cag ttc agt ctt tac 
lie His Asp His Phe He Pro He Glu Lys Tyr Gin Phe Ser Leu Tyr 

„„ 0 09s 830 

820 

■ 

cca ata ttt atg gaa gga gtg gga aaa cca aag ata att aat agt ttc 
Pro He Phe Met Glu Gly Val Gly Lys Pro Lys He He Asn Ser Phe 

Q /I cr 



835 



840 845 



act caa gat gat att gaa aaa cac cag agt gat gca ggt tta tat gta 
Thr Gin Asp Asp He Glu Lys His Gin Ser Asp Ala Gly Leu Tyr Val 

a a r\ 



850 



855 860 



2256 



att gtg cca gta att att tec tct tec ate tta ttg ctt gga aca tta 
Xle Val Pro val He He Ser Ser Ser He Leu Leu Leu Gly Thr Leu 

o 7 n 875 88U 

865 870 

tta ata tea cac caa aga atg aaa aag eta ttt tgg gaa gat gtt ccg 
Leu He Ser His Gin Arg Met Lys Lys Leu Phe Trp Glu Asp Val Pro 

890 895 



2304 



885 



2352 



aac ccc aag aat tgt tec' tgg gca caa gga ctt aat ttt cag aag aga 
Asn Pro Lys Asn Cys Ser Trp Ala Gin Gly Leu Asn Phe Gin Lys Arg 

900 905 910 

acg gac att ctg gat cca ccg gtc gec acc atg gtg age aag ggc gag 
Thr Asp He Leu Asp Pro Pro Val Ala Thr Met Val Ser Lys Gly Glu 
915 920 925 



2400 



2448 



2496 



2544 



2592 



2640 



2688 



2736 



2784 



."J 



'I 



37 
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gag ctg ttc acc ggg gtg gtg ccc ate ctg gtc gag ctg gac ggc gac 
Glu Leu Phe Thr Gly Val Val Pro He Leu Val Glu Leu Asp Gly Asp 
930 935 940 

gta aac ggc cac aag ttc age gtg tec ggc gag ggc gag ggc gat gee 
Val Asn Gly His Lys Phe Ser Val Ser Gly Glu Gly Glu Gly Asp Ala 
945 950 955 960 

acc tac ggc aag ctg acc ctg aag ttc ate tgc acc acc ggc aag ctg 
Thr Tyr Gly Lys Leu Thr Leu Lys Phe He Cys Thr Thr Gly Lys Leu 

965 970 975 

ccc gtg ccc tgg ccc acc etc gtg acc acc ttc ggc tac ggc gtg cag 
Pro Val Pro Trp Pro Thr Leu Val Thr Thr Phe Gly Tyr Gly Val Gin 

980 985 990 

tgc ttc gee cgc tac ccc gac cac atg cgc cag cac gac ttc ttc aag 
Cys Phe Ala Arg Tyr Pro Asp His Met Arg Gin His Asp Phe Phe Lys 
995 1000 1005 

tec gee atg ccc gaa ggc tac gtc cag gag cgc acc ate ttc ttc aag 
Ser Ala Met Pro Glu Gly Tyr Val Gin Glu Arg Thr He Phe Phe Lys 
1010 1015 1020 

gac gac ggc aac tac aag acc cgc gee gag gtg aag ttc gag ggc gac 
Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp 
1025 1030 1035 1040 

acc ctg gtg aac cgc -ate gag ctg aag ggc ate gac ttc aag gag gac 
Thr Leu Val Asn Arg He Glu Leu Lys Gly He Asp Phe Lys Glu Asp 

1045 1050 1055 

ggc aac ate ctg ggg cac aag ctg gag tac aac tac aac age cac aac 
Gly Asn He Leu Gly His Lys Leu Glu Tyr Asn Tyr Asn Ser His Asn 

1060 1065 1070 

gtc tat ate atg gee gac aag cag aag aac ggc ate aag gtg aac ttc 
Val Tyr He Met Ala Asp Lys Gin Lys Asn Gly He Lys Val Asn Phe 
1075 • 1080 1085 

aag ate cgc cac aac ate gag gac ggc age gtg cag etc gee gac cac 
Lys He Arg His Asn He Glu Asp Gly Ser Val Gin Leu Ala Asp His 
1090 1095 1100 

tac cag cag aac acc ccc ate ggc gac ggc ccc gtg ctg ctg ccc gac 
Tyr Gin Gin Asn Thr Pro He Gly Asp Gly Pro Val Leu Leu Pro Asp 
1105 IHO ll 15 1120 



2832 



2880 



2928 



2976 



3024 



3072 



3120 



3168 



3216 



3264 



3312 



3360 



38 
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a ac c.c tac ct. age t ac c, s tec „=c ctg a.a gac ccc aac 
*s„ His T,r Leu Ser Tyr Gin Ser Ala Leu Ser Lys *sp To «n 



3408 



1125 1130 



aag cgc gat cac atg gtc ctg ctg gag ttc gtg acc gec gee ggg ate 
L ys Arg Asp His Met Val Leu Leu Glu Phe Val Thr Ma Ala Gly 

1145 llbU 



3456 



1140 



act etc ggc atg gac gag ctg tac aag taa 
Thr Leu Gly Met Asp Glu Leu Tyr Lys 
1155 1160 



3486 



<210> 14 
<211> 1161 
<212> PRT 

<213> Sequence artificielle 

<223> Description de la sequence artificielle : OBR YFP 

Met 0 Vai 4 Leu Ala Ser Ser Thr Thr Ser lie His Thr Met Leu Leu Leu 

q 10 lb 

1 5 

L eu Leu Met Leu Phe His Leu Gly Leu Glh Ala Ser He Ser Ala Arg 

20 ^ 

Cln Glu Gin Lys Leu He Ser Glu Glu Asp Leu Thr Arg Tyr Pro He 

35 40 . 

. TM1 rvs M et Pro Pro Asn Ser Thr Tyr 

Thr Pro Trp Arg Phe Lys Leu Ser Cys Met 

cc 60 
50 bb 

at- r-w iPii Ser Lvs Asn Thr Ser Asn Ser 
Asp Tyr Phe Leu Leu Pro Ala Gly Leu ser i,ys ^ 

65 ; 70 75 - 

mv. ,u u»i riu Pro Lvs Phe Asn Ser Ser Gly 
Asn Gly His Tyr Glu Thr Ala Val Glu Pro uy* 

85 9° . . 9 

Thr His Phe Ser Asn Leu Ser Lys Thr Thr Phe His Cys Cys Phe Arg 

100 105 1 

Ser Glu Gin Asp Arg Asn Cys Ser Leu Cys Ala Asp Asn He Glu Gly 
115 120 

Thr Thr Phe Val Ser Thr Val Asn Ser Leu Val Phe Gin Gin He Asp 
130 135 
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Ala Asn Trp Asn He Gin Cys Trp Leu Lys Gly Asp Leu Lys Leu Phe 

150 ' 155 160 



145 



He Cys Tyr Val Glu Ser Leu" Phe Lys Asn Leu Phe Arg ? ,Asn Tyr Asn 

165 



170 175 



Tyr Lys Val His Leu Leu' Tyr Val Leu Pro Glu Val Leu Glu Asp Ser 

180 185 190 

Pro Leu Val Pro Gin Lys Gly Ser Phe Gin Met Val His Cys Asn Cys 
195 200 205 

. Ser Val His Glu Cys Cys Glu" Cys Leu Val Pro Val Pro Thr Ala Lys 
210 215 220 

Leu Asn Asp Thr Leu Leu Met Cys Leu Lys He Thr Ser Gly Gly Val 

„ n 235 240 

225 230 



He Phe Arg Ser Pro Leu Met Ser Val Gin Pro He Asn Met Val Lys 

245 



250 255 



Pro Asp Pro Pro Leu Gly Leu His Met Glu He Thr Asp Asp Gly Asn 

260 265 270 

Leu Lys He Ser Trp Ser Ser Pro Pro Leu Val Pro Phe Pro Leu Gin 
275 280 285 

Tyr Gin Val Lys Tyr Ser Glu Asn Ser Thr Thr Val He Arg Glu Ala 
290 295 300 

Asp Lys He Val Ser Ala Thr Ser Leu Leu Val Asp Ser He Leu Pro 

„„ 315 320 

305 310 ■ J - LD 

Gly Ser Ser Tyr Glu Val. Gin Val Arg Gly Lys Arg Leu Asp Gly Pro 

325 330 335 

Gly He Trp Ser Asp Trp Ser Thr Pro Arg Val Phe Thr Thr Gin Asp 

340 345 350 

Val He Tvr Phe Pro Pro Lys He Leu Thr Ser Val Gly Ser Asn Val 
355 360 365 

Ser Phe His Cys He Tyr Lys Lys Glu Asn Lys lie Val Pro Ser Lys. 
370 375 ' 380 

Glu He Val Trp Trp Met Asn Leu Ala Glu Lys He Pro Gin Ser Gin 
385 390 395 400 



40 
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Tyr Asp Val Val Ser Asp His Val Ser Lys Val Thr Phe Phe Asn Leu 

410 415 



405 



Asn Glu Thr Lys Pro Arg Gly 'Lys.Phe Thr Tyr Asp Ala Val Tyr Cys 

425 430 



420 



Cys Asn Glu His Glu Cys His His Arg Tyr Ala Glu Leu Tyr Val lie 

440 t 445 



435 



Asp 



Val Asn lie Asn lie Ser Cys Glu Thr Asp.Gly Tyr Leu Thr Lys 



450 



455 



460 



Met Thr Cys Arg Trp Ser Thr Ser Thr He Gin Ser Leu Ala Glu Ser 



465 



470 



475 



T hr Leu Gin Leu Arg Tyr His Arg Ser Ser Leu Tyr Cys Ser Asp He 



485 



490 



495 



Pro Ser He His Pro He Ser Glu Pro Lys Asp Cys Tyr Leu Gin Ser 

500 • 505 510 

Asp Gly Phe Tyr Glu Cys He Phe Gin Pro lie Phe Leu Leu Ser Gly 



515 



520 



525 



Tyr Thr Met Trp He Arg He Asn His Ser Leu Gly Ser Leu Asp Ser 



540 

530 b3b 



Pro Pro Thr Cys Val Leu Pro Asp Ser Val Val Lys Pro Leu Pro Pro 



545 



Ser 



550 



555 



Ser Val Lys Ala Glu lie Thr lie Asn He Gly Leu Leu Lys He 



565 



570 



575 



Ser Trp- Glu Lys Pro Val Phe Pro Glu Asn Asn Leu Gin Phe Gin He 



580 



585 



590 



Arg Tyr Gly Leu Ser Gly Lys Glu Val Gin Trp Lys Met Tyr Glu Val 
595 - 600 605 

Asp Ala Lys Ser Lys Ser Val Ser Leu Pro Val Pro Asp Leu Cys 



Tyr 



610 



615 



xv i \7a^ ara Cvs Lvs* Arg Leu Asp Gly Leu Gly 

Ala Val Tyr Ala Val Gin Val Arg cys uy*> y 

Tyr Trp Ser Asn Trp Ser Asn Pro Ala Tyr Thr Val Val Met Asp He 



645 



650 
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Lys Val Pro Met 

660 

Thr Met Lys Lys 
675 

Lys Asn Asp Ser 
690 

Thr Ser Cys Asn 
705 

Phe Thr Phe Leu 



lie Asn Ser lie 

740 

Trp Pro Met Ser 
755 

Leu Asn Ser Ser 
770 

Tyr Lys Leu Met 
785 

Gly Glu He Lys 



He His Asp His 

820 

Pro He Phe Met 
835 

Thr Gin Asp Asp 
850 

He Val Pro Val 
865 

Leu He Ser His 



Asn Pro Lys Asn 

900 



Arg Gly Pro Glu 



Glu Lys Asn Val 

680 

Leu Cys Ser Val 
695 

Gly Thr Trp Ser 
710 

Trp Thr Glu Gin 
725 

Gly Ala Ser Val 



Lys Val Asn He 

760 

Cys Val He Val 
. 775 

Tyr Phe He He 
790 

Trp Leu Arg He 
805 

Phe He Pro He 



Glu Gly Val Gly 

840 

He Glu Lys His 
855 

lie lie Ser Ser 
870 

Glri Arg Met Lys 
885 

Cys Ser Trp Ala 



42 



Phe Trp Arg He 
665 

Thr Leu Leu Trp 



Gin Arg Tyr Val 

700 

Glu Asp Val Gly 

' 715 

Ala His Thr Val 
730 

Ala Asn Phe Asn 
745 

Val Gin Ser Leu 



Ser Trp He Leu 

780 

Glu Trp Lys Asn 
795 

Ser Ser Ser Val 
810 

Glu Lys Tyr Gin 
825 

Lys Pro Lys He 



Gin Ser Asp Ala 

860 

Ser He Leu Leu 
875 

Lys Leu Phe Trp 
890 

Gin Gly Leu Asn 
905 



tie Asn Gly Asp 
670 

Lys Pro Leu Met 
685 

He Asn His His 



Asn His Thr- Lys 

720 

Thr Val Leu Ala 
735 

Leu Thr Phe Ser 
750 

Ser Ala Tyr Pro 
765 

Ser Pro Ser Asp 



Leu Asn Glu Asp 

800 

Lys Lys Tyr Tyr 
815 

Phe Ser Leu Tyr 
83 0 

He Asn Ser Phe 
845 

Gly Leu Tyr Val 



Leu Gly Thr Leu 

• . 880 

Glu Asp Val Pro 
895 

Phe Gin Lys. Arg 
910 
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Thr Asp He Leu Asp Pro Pro Val Ala Thr Met Val Ser Lys Gly Glu 
915 920 92T, 

Glu Leu Phe Thr Gly Val Varl .Pro He Leu Val Glu Leu Asp Gly Asp 
930 935 940 

Val Asn Gly His Lys Phe Ser Val Ser Gly Glu Gly Glu Gly Asp Ala 
945 950 955 , 960 

Thr Tyr Gly Lys Leu Thr Leu Lys Phe He Cys Thr Thr Gly Lys Leu 

965 970 975 

Pro Val Pro Trp Pro Thr Leu Val Thr Thr Phe Gly Tyr Gly Vol Gin 

980 985 990 

* 

Cys Phe Ala Arg Tyr Pro Asp His Met Arg Gin His Asp Phe Phe Lys 
995 1000 1005 

Ser Ala Met Pro Glu Gly. Tyr Val Gin Glu Arg Thr He Phe Phe Lys 
1010 1015 1020 

Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp 
025 1030 ' • 1035 1040 

Thr Leu Val Asn. Arg He Glu Leu Lys Gly lie Asp Phe Lys Glu Asp 

1045 1050 1055 

Gly Asn He Leu 1 Gly His Lys Leu Glu Tyr Asn Tyr Asn Ser His Asn 

1060 1065 1070 

Val Tyr lie Met Ala Asp Lys Gin Lys Asn Gly He Lys Val Asn Phe 
1075 1080 1085 

Lys He Arg His Asn He Glu Asp Gly Ser Val Gin Leu Ala Asp His 
1090 1095 1100 

y 

S 

Tyr Gin Gin Asn Thr Pro lie Gly Asp Gly, Pro Val Leu Leu Pro Asp 
105 , v 1110 1H5 1120' 

* 

Asn His Tyr Leu Ser Tyr Gin Ser Ala Leu Ser Lys Asp Pro Asn Glu 

112 5 113 0 113 5 

Lys Arg Asp His Met Val Leu Leu Glu Phe Val Thr Ala Ala Gly He 

1140 1145 1150 

Thr Leu Gly Met Asp Glu Leu Tyr Lys 
1155 . 1160 
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<210> 15 
<211> 396 
<212> ADN 
<213> Homo sapiens 

<220> 
<221> CDS 
<222> (1) . . (396) 

It^gcTggc ate aaa get ttg att agt ttg tec ttt gga gga gea ate 
Met Ala Gly He Lys Ala Leu He Ser Leu Ser Phe Gly Gly Ala He 
! 5 . 10 15 

gga ctg atg ttt ttg atg ctt gga tgt gee ctt cca ata tac aac aaa 
Gly Leu Met Phe Leu Met Leu Gly Cys Ala Leu Pro He Tyr Asn Lys 

20- • ... 25 30 

tae tgg cee etc ttt gtt eta ttt ttt tac ate ctt tea eet att cca 
Tyr Trp Pro Leu Phe Val Leu Phe Phe Tyr He Leu Ser Pro He Pro 

35 40 45 

tac tgc ata gea aga aga tta gtg gat gat aea gat get atg agt aac 
Tyr Cys He Ala Arg Arg Leu Val Asp Asp Thr Asp Ala Met Ser Asn 
50 55 60 

get tgt aag gaa ctt gee ate ttt ctt aea aeg ggc att gtc gtg tea 
Ala Cys Lys Glu Leu Ala He Phe Leu Thr Thr Gly He Val Val Ser 



65 



70 75 



act ttt gga etc ect att gta ttt gee aga gea eat ctg att gag tgg 
Ala Phe Gly Leu Pro He Val Phe Ala Arg Ala His Leu He Glu Trp 

85 



90 95 



gga get tgt gea ett gtt etc aea gga aac aca gtc ate ttt gea act 
Gly Ala Cys Ala Leu Val Leu Thr Gly Asn Thr Val He Phe Ala Thr 



100 



105 HO 



ata eta ggc ttt tte ttg gtc ttt gga age aat gae gae tte age tgg 
He Leu Gly Phe Phe Leu Val Phe Gly Ser Asn Asp Asp Phe Ser Trp 

. _ 1 O EL 



115 

cag cag tgg tga 
Gin Gin Trp 
130 



120 125 



48 



96 



144 



192 



240 



288 



336 



384 



396 



44 
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<210> 16 
<211> 131 
<212> PRT 

<213> Homo sapiens 
<400> 16 

Met Ala Gly He Lys Ala Leu He Ser Leu Ser Phe Gly Gly Ala He 
15 10 15 

Gly Leu Met Phe Leu Met Leu Gly Cys Ala Leu Pro He Tyr Asn Lys 

20 25 30 

Tyr Trp Pro Leu Phe Val Leu Phe Phe Tyr lie Leu Ser Pro He Pro 

35 40 '45 

Tyr Cys He Ala Arg Arg Leu Val Asp Asp Thr Asp Ala Met Ser Asn 
50 -55 60 

Ala Cys Lys Glu Leu Ala lie Phe Leu Thr Thr Gly He Val Val Ser 

nr\ 75 80 

65 70 / 3 . 

Ala Phe Gly Leu Pro He Val Phe Ala Arg Ala His Leu He Glu Trp 

85 90 95 

Gly Ala Cys Ala Leu Val Leu Thr Gly Asn Thr Val He Phe Ala Thr 

100 105 HO 

He Leu Gly Phe Phe Leu Val Phe Gly Ser Asn Asp Asp Phe Ser Trp 
115 120 125 

Gin Gin Trp 
13 0 



<210> 17 '• 

<211> 1359 < 

<212> ADN v 

<213> Sequence artif icielle 

<220> '• . 

<221> CDS 

<222> (1)..{1359) 

<220> 

<223> Description de la sequence artif icielle :MY47 LUC 



45 
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<400> 17 

atg gca ggc ate aaa get ttg att agt ttg" tec ttt gga gga gca ate 

Met Ala Gly He Lys Ala Leu He Ser Leu Ser Phe Gly Gly Ala He 

5 10 K 15 



1 



gga ctg atg ttt ttg atg ctt gga tgt gec ctt cca ata tac 
Gly Leu Met Phe Leu Met Leu Gly Cys Ala Leu Pro He Tyr Asn Lys 

20 



25 30 



tae tgg eee ete ttt gtt eta ttt ttt tae ate ett tea eet att cca. 
Tyr Trp Pro Leu Phe Val Leu Phe Phe Tyr He Leu Ser Pro He Pro 

35 40 45 

tac tge ata gca aga aga tta gtg gat gat aea gat get atg agt aae 
Tyr Cys He Ala Arg Arg Leu Val Asp Asp Thr Asp Ala Met Ser Asn 



50 



55 60 



get tgt aag gaa ett gee ate ttt ett aea acg ggc att gte gtg tea 
Ala Cys Lys Glu Leu Ala He Phe Leu Thr Thr Gly He Val Val Ser 
65 70 ?5 80 

get ttt gga ete eet att gta ttt gee aga gca eat ctg att gag tgg 
Ala Phe Gly Leu Pro He Val Phe Ala Arg Ala His Leu He Glu Trp 

85 90 95 

gga get tgt gca ctt gtt etc aea gga aac aea gtc ate ttt gca act 
Gly Ala Cys Ala Leu Val Leu Thr Gly Asn Thr Val He Phe Ala Thr 



100 



105 



48 



96 



ata eta ggc ttt ttc ttg gtc ttt gga age aat gac gac ttc age tgg 
He Leu Gly Phe Phe Leu Val Phe Gly Ser Asn Asp Asp Phe Ser Trp 
115 120 125 

cag cagtgg cga ccg gtg gat cca cog get aga gec acc atg ace -age 
Gin Gin Trp Arg Pro Val Asp Pro Pro Ala Arg Ala Thr Met Thr Ser 
130 135 "0 

aag gtg tac gac ccc gag cag agg aag agg atg ate acc ggc ccc cag 
l V s val Tyr Asp Pro Glu Gin Arg Lys Arg Met He Thr Gly Pro Gin 
145 150 155 

tgg tgg gec agg tge aag cag atg aac gtg ctg gac age ttc ate aac 
Z Trp Ala Arg Cys Lys Gin Met Asn Val Leu Asp Ser Phe lie Asn 



165 



170 



144 



tae tac gac age gag aag cac gec gag aac gec gtg ate ttc ctg cac 
Tyr Tyr Asp Ser Glu Lys His Ala Glu Asn Ala Val He Phe Leu His 

180 185 

46 



192 



240 



288 



336 



384 



432 



480 



528 



576 
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672 



720 



768 



ggc aac gcc get age age tac etg tgg agg cac gtg gtg ccc cac ate 624 
Gly Asn Ala Ala Ser Ser Tyr- Leu Trp Arg His Val Val Pro His He 
195 200 205 

gag ccc gtg gcc agg tgc ate ate ccc gat ctg ate ggc atg ggc aag 
Glu Pro Val Ala Arg Cys lie He Pro Asp Leu He Gly Met Gly Lys 
210 215 220 

age ggc aag age ggc aac ggc age tac agg ctg ctg gac cac tac aag 
Ser Gly Lys Ser Gly Asn Gly Ser Tyr Arg Leu Leu Asp His Tyr Lys 
225 230 235 240 

tac ctg acc gcc tgg ttc gag etc ctg aac ctg ccc aag aag ate ate 
Tyr Leu Thr Ala Trp Phe Glu Leu Leu Asn Leu Pro Lys Lys lie He 

245 250 255 

ttc gtg ggc cac gac tgg ggc gcc tgc ctg gcc ttc cac tac age tac 
Phe Val Gly His Asp Trp Gly Ala Cys Leu Ala Phe His Tyr Ser Tyr ■ 

260 265 270 

gag cac cag gac aag ate aag gcc ate gtg cac gcc gag age gtg gtg 864 f 
Glu His Gin Asp Lys lie Lys Ala He Val His Ala Glu Ser Val Val 
275 280 285 

gac gtg ate gag age tgg gac gag tgg cca gac ate gag gag gac ate 912 # 
Asp Val He Glu Ser Trp Asp Glu Trp- Pro Asp He Glu Glu Asp He 
290 295 300 



816 



* ■ 



gcc ctg ate aag age gag gag ggc gag aag atg gtg ctg gag aac aac 
Ala Leu He Lys Ser Glu Glu Gly Glu Lys Met Val Leu Glu Asn Asn 
305 310 315 " 320 

ttc ttc gtg gag acc atg ctg ccc age aag ate atg aga aag ctg gag 

Phe Phe Val Glu Thr Met Leu Pro Ser Lys He Met Arg Lys Leu Glu 

325 330 * 335 

- ■_ s 

ccc gag gag ttc gcc gcc tac ctg gag ccc ttc aag gag aag ggc gag 

Pro Glu Glu Phe Ala Ala Tyr Leu Glu Pro Phe Lys Glu Lys Gly Glu 

340. 345 350 

gtg aga aga ccc acc ctg age tgg ccc aga gag ate ccc ctg gtg aag 
Val Arg Arg Pro Thr Leu Ser Trp Pro Arg Glu He Pro Leu Val Lys 
355 360 365 

ggc ggc aag ccc gac gtg gtg cag ate gtg aga aac tac aac gcc tac 
Gly Gly Lys Pro Asp Val Val Gin He Val Arg Asn Tyr Asn Ala Tyr 
370 375 380 



960 



1008 



1056 



1104 



1152 



47 
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ctg aga gcc age gac .gac ctg. eee aag atg ttc ate gag age gac ccc 
ccg ay u a IleGlu.Ser Asp. Pro 

Leu Arg Ala Ser Asp Asp Leu Pro Lys Met me 

390 ' 395 j*£ 40U 



385 



gge tte tte age aae gee ate gtg gag gge gee aag' aag. ttc. eee aae 
lly Phe Phe Ser Asn Ala He Val Glu Gly Ala Lys Lys Phe :Pro Asn 

410 415 



405 



aee gag tte gtg aag gtg aag gge ctg eae tte age eag gag gac gee 
Thr Glu Phe Val Lys Val Lys Gly Leu His Phe Ser Gin Glu Asp Ala 

425 430 



420 



eee gae gag atg gge aag tae ate aag age tte gtg gag aga gtg etg 
Pro Asp Glu Met Gly Lys Tyr He Lys Ser Phe Val Glu Arg Val Leu 

. - - a A t; 



435 

aag aac gag cag taa 
Lys Asn Glu Gin 
450 



440 445 



1200 



1248 



1296 



1344 



1359 



<210> 18 
<211> 452 
<212> PRT 

<213> Sequence artificielle 

<223> Description de la sequence artificielle :MY47 LUC 



<400> 18 
Met Ala Gly He 
1 

Gly Leu Met Phe 

20 

Tyr Trp Pro Leu 

35 

Tyr Cys He Ala 
50 

Ala Cys Lys Glu 
65 

Ala Phe Gly Leu 



Gly Ala Cys Ala 



Lys Ala Leu He 
5 

Leu Met Leu Gly 



Phe Val Leu Phe 

40 

Arg Arg Leu Val 

55 

Leu Ala He Phe 
70 

Pro lie Val Phe 
85 

Leu Val Leu Thr 



Ser Leu Ser Phe 
10 

Cys Ala Leu Pro 
25 

Phe Tyr He Leu 

..* 

Asp Asp Thr Asp 

60 

Leu Thr Thr Gly 

75 

Ala Arg Ala His 
90 

Gly Asn Thr Val 



Gly Gly Ala He 

15 

He Tyr Asn Lys 
30 

Ser Pro He Pro 
45 

Ala Met Ser Asn . 



He Val Val Ser 

. 80 

Leu He Glu Trp 

95 

He Phe Ala Thr 



48 
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100 105 HO 



Gly Phe Phe Leu Val -Phe Gly Ser Asn. Asp Asp Phe Ser Trp 
115 



lie Leu 

120 125 



Gin Gin Trp Arg Pro Val Asp Pro Pro Ala Arg Ala Thr Met Thr Ser 
130 



135 .140 



L ys Val Tyr Asp Pro Glu Gin Arg Lys Arg Met lie Thr Gly Pro Gin 

150 155 



145 



Trp Trp Ala Arg Cys Lys Gin Met Asn Val Leu Asp Ser Phe lie Asn 

165 



170 175 



Tyr Tyr Asp Ser Glu Lys His Ala Glu Asn Ala Val lie Phe Leu His 

180 



185 19° 

Gly Asn Ala Ala Ser Ser Tyr Leu Trp Arg His Val Val Pro His He 
195 200 205 

Glu Pro Val Ala Arg Cys He He Pro Asp Leu He Gly Met Gly Lys 
210 215 220 

Ser Gly Lys Ser Gly Asn Gly Ser Tyr Arg Leu Leu Asp His Tyr Lys 

otr 240 
225 230 235 

Tyr Leu Thr Ala Trp Phe Glu Leu Leu Asn Leu Pro Lys Lys He He 

245 ' 250 255 

Val Gly His Asp Trp Gly Ala Cys Leu Ala Phe His Tyr Ser Tyr 



Phe 

260 



265 270 



Glu His Gin Asp Lys He Lys Ala He Val His Ala Glu Ser Val Val 
275 



280 285 



Asp Val lie Glu Ser Trp Asp Glu Trp Pro Asp lie Glu Glu Asp lie 

29 0 < 



295 300 



s 



Ala Leu lie Lys Ser Glu Glu Gly Glu Lys Met Val Leu Glu Asn Asn 
305 310 315 , 320 



Phe Phe Val Glu Thr Met Leu Pro Ser Lys He Met Arg Lys Leu Glu 

325 



330 335 



Pro Glu Glu Phe Ala Ala Tyr Leu Glu Pro Phe Lys Glu Lys Gly Glu 

340 



345 350 



Val Arg Arg Pro Thr Leu Ser Trp Pro Arg Glu He Pro Leu Val Lys 
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355 

Gly Gly Lys Pro 
370 

Leu Arg Ala Ser 
3 85 

Gly Phe Phe Ser 



Thr Glu Phe Val 

420 

Pro Asp Glu Met 
435 

Lys Asn Glu Gin 
450 



360 

Asp Val Val Gin 
375 

» 

Asp Asp Leu Pro 
390 

* 

Asn Ala He Val 
405 

Lys Val Lys Gly 



Gly Lys Tyr He 

440 



He Val Arg Asn 

380 

Lys Met Phe He 
395 

Glu Gly Ala Lys 
410 

Leu His Phe Ser 
425 

Lys Ser Phe Val 



365 

Tvr Asn Ala Tyr 

> - 

Glu Ser Asp Pro 

400 

Lys Phe Pro Asn 
415 

Gin Glu Asp Ala 
430 

Glu Arg Val Leu 
445 



<210> 19 
<211> 1140 
<212> ADN 

<213> Sequence artificielle 

<220> 

<221> CDS 

<222> (1) . . (1140) 

<220> , ' 

<223> Description de la sequence artificielle : MY47 YFP 

<400> 19 

atg gca ggc ate aaa get ttg att agt ttg tec ttt gga gga gca ate 
Met Ala Gly He Lys Ala Leu He Ser Leu. Ser Phe Gly Gly Ala He 
1 5 • 10 15 

gga ctg atg ttt ttg atg ctt gga tgt gcc ctt cca ata tac aac aaa 
Gly Leu Met Phe Leu Met Leu Gly Cys Ala Leu Pro He Tyr Asn Lys 

20 25 30 

tac tgg ccc etc ttt gtt eta ttt ttt tac ate ctt tea cct att cca 
Tyr Trp Pro Leu Phe Val Leu Phe Phe Tyr He Leu Ser Pro lie Pro 

35 40 45 

tac tgc ata gca aga aga tta gtg gat gat aca gat get atg agt aac 



48 



96 



144 



192 



50 



1 er depot. 



9 



240 



288 



225 



336 



ttc aag gac gac ggc aac tac aag acc cgc gcc gag gtg aag ttc gag 



384 



Tyr Cys He Ala Arg Arg Leu Val Asp Asp Thr Asp Ala Met Ser Asn 
50 55 60 

get tgt aag gaa ctt gcc ate ttt ctt aca acg ggc att gtc gtg tea 
Ala Cys Lys Glu Leu Ala lie Phe Leu Thr Thr Gly He Val Val Ser 
65 70 75 . 80 

get ttt gga etc cct att gta ttt gcc aga gca cat ctg att gag tgg 
Ala Phe Gly Leu Pro He Val Phe Ala Arg Ala His Leu He Glu Trp 

85 " 90 ' 95 

gga get tgt gca ctt gtt etc aca gga aac aca gtc ate ttt gca act 
Gly Ala Cys Ala Leu Val Leu Thr Gly Asn Thr Val He Phe Ala Thr 

100 105 110 

ata eta ggc ttt ttc ttg gtc ttt gga age aat gac gac ttc age tgg 
He Leu Gly Phe Phe Leu Val Phe Gly Ser Asn Asp Asp Phe Ser Trp _ 
115 120 125 . 

cag cag tgg cga ccg gtg gat cca ccg gtc gcc acc atg gtg age aag . 432 
Gin Gin Trp Arg Pro Val Asp Pro Pro Val Ala Thr Met Val Ser Lys 
130' 135 140 

ggc gag gag ctg ttc acc ggg gtg gtg ccc ate ctg gtc gag ctg gac 480 
Gly Glu Glu Leu Phe Thr Gly Val Val Pro He Leu Val Glu Leu Asp 
145 150 155 . , 160 

ggc gac gta aac ggc cac aag ttc age gtg tec ggc gag ggc gag ggc 
Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu Gly Glu Gly 

165 170 175 

gat gcc acc tac ggc aag ctg acc ctg aag ttc ate tgc acc acc ggc 
Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe He Cys Thr Thr Gly 

180 185 190 

aag ctg ccc gtg ccc tgg ccc acc etc gtg acc acc ttc ggc tac ggc 62 4 
Lys Leu, Pro Val Pro Trp Pro Thr Leu Val Thr Thr Phe Gly Tyr Gly 

>195 ,• 200 205 

gtg cag tgc ttc gcc cgc tac ccc gac cac atg cgc cag cac gac ttc 672 
Val Gin Cys Phe Ala Arg Tyr Pro Asp His Met Arg Gin His Asp Phe . 
210 ' 215 220 

ttc aag tec gcc atg ccc gaa ggc tac gtc cag gag cgc acc ate ttc 72 0 
Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gin Glu Arg Thr He Phe 

230 235 240 



528 



576 



768 



3-. 



51 



1er depot 



Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu 

245 250 255 

ggc gac acc ctg gtg aac cgc ate gag ctg aag ggc at;c gac ttc aag 
Gly Asp Thr Leu Val Asn Arg He Glu Leu Lys Gly He Asp Phe Lys . 

260 265 270 

gag gac ggc aac ate ctg ggg cac aag ctg gag tac aac tac aac age 
Glu Asp Gly Asn He Leu Gly His Lys Leu Glu Tyr Asn Tyr Asn Ser 
275 r 280 285 

cac aac gtc tat ate atg gec gac aag cag aag aac ggc ate aag gtg 
His Asn Val Tyr He Met Ala Asp Lys Gin Lys Asn Gly He Lys Val 
290 295 300 

aac ttc aag ate cgc cac aac ate gag gac ggc age gtg cag etc gee 
Asn Phe Lys He Arg His Asn He Glu Asp Gly Ser Val Gin Leu Ala 
305 310 315 * 320 

gac cac tac cag cag aac acc ccc ate ggc gac ggc ccc gtg ctg ctg 
Asp His Tyr Gin Gin Asn Thr Pro He Gly Asp Gly Pro Val Leu Leu 

325 330 335 ' 

ccc gac aac cac tac ctg age tac cag tec gee ctg age aaa gac ccc 
Pro Asp Asn His Tyr Leu Ser Tyr Gin Ser Ala Leu Ser Lys Asp Pro 

340 345 350 

aac gag aag cgc gat cac atg gtc ctg ctg gag ttc gtg acc gee gee 
Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val Thr Ala Ala 
355 360 365 

ggg ate act etc ggc atg gac gag ctg tac aag taa 
Gly He Thr Leu Gly Met Asp Glu Leu Tyr Lys 

370 375 380 



816 



864 



912 



960 



1008 



1056 



1104 



1140 



<210> 20 
<211> 379 
<212> PRT 

<213> Sequence artificielle 

<223> Description de la sequence artificielle : MY47 YFP 
<400> 20 

Met Ala Gly He Lys Ala Leu He Ser Leu Ser Phe Gly Gly Ala He 
15 10 15 

Gly Leu Met Phe Leu Met Leu Gly Cys Ala Leu Pro He Tyr Asn Lys 

20 " 25 30 



52 
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Tyr Trp Pro Leu Phe Val 

35 

Tyr Cys He Ala -Arg Arg 
50 

Ala Cys Lys Glu Leu Ala 
65 70 

Ala Phe Gly Leu Pro He 

t\ 85 

Gly Ala Cys Ala Leu Val 

100 

He Leu Gly Phe Phe 
115 

Gin Gin Trp Arg Pro 
130 

Gly Glu Glu Leu Phe 

145 ■ ' • : 

Gly Asp Val Asn Gly 

165 

Asp Ala Thr Tyr Gly 

180 

Lys Leu Pro Val Pro 
195 

Val Gin Cys Phe Ala 
210 

-.„•*' 

Phe Lys Ser Ala Met 
225 

Phe Lys Asp Asp Gly 

245 

Gly Asp Thr Leu Val 

260 

Glu Asp Gly Asn He 
275 



Leu Phe Phe Tyr lie 
40 

Leu Val Asp Asp Thr 
55 

He Phe Leu Thr Thr 

75 

Val Phe Ala Arg Ala 

90 

Leu Thr* Gly Asn Thr 
105 

Leu Val Phe Gly Ser Asn 
120 

Val. Asp. Pro Pro Val Ala 
135 

Thr Gly Val Val Pro He 
150 155 

His Lys Phe Ser Val Ser 

170 

Lys Leu Thr Leu Lys Phe 

185 

Trp Pro Thr Leu Val Thr 
200 

Arg Tyr Pro Asp His Met 
215 

Pro Glu Gly Tyr Val Gin 
230 235 

Asn Tyr Lys Thr, Arg Ala 

250 

Asn Arg He Glu Leu Lys 

265 

Leu Gly His Lys Leu Glu 
280 



Leu Ser Pro He Pro 
45 

Asp Ala Met Ser Asn 
60 

Gly He Val Val Ser 

80 

His Leu He Glu Trp 

95 

Val He Phe Ala Thr' 
110 

Asp Asp Phe Ser Trp 
125 

Thr Met Val Ser Lys 
140 

Leu Val Glu Leu Asp 

160 

Gly Glu Gly Glu Gly 

175 

He Cys Thr Thr Gly 
190 

Thr Phe Gly Tyr Gly 
205 

Arg Gin His Asp Phe 
220 

Glu Arg Thr lie Phe 

2 40 

Glu Val Lys Phe Glu 

. 255 

Gly He Asp Phe Lys 
270 

Tyr Asn Tyr Asn Ser 
285 
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His Asn Val Tyr lie Met Ala Asp Lys Gin Lys Asn Gly lie Lys Val 
290 295 300 

Asn Phe Lys lie Arg His Asn lie Glu Asp Gly Ser Val Gin Leu Ala 
305 310 315 320 

Asp His Tyr Gin Gin Asn Thr Pro He Gly Asp Gly Pro Val Leu Leu 

325 330 335 

m 

Pro Asp Asn His Tyr Leu Ser Tyr Gin Ser Ala Leu Ser Lys Asp Pro 

340 345 350 

Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val Thr Ala Ala 
355 360 365 

Gly He Thr Leu Gly Met Asp Glu Leu Tyr Lys 
370 375 



<210> 21 
<211> 1114 
<212> ADN 

<213> Homo sapiens 
<400> 21 

gtctggcttg ggcaggctgc ccgggccgtg 
ttcgggagac atggcgggcg ttaaagctct 
actgactttt cttatgctgg gatgtgcctt 
cgtcctgatt ttccacgcca tctcccccat 
tgactcagat gcaaccagta gtgcctgtcg 
tgttgtttct gcctttggat ttcctgttat 
agcctgcggc cttgtgttgg caggcaatgc 
ccttatattt ggaagaggag atgattttag 
tacagtgcat tgaatttctt agaactcata 
ttactatgaa atttaatatg ctgggttttt 
gaaagacttc ataagtagga gatgagtttt 
attatgttac tcaaattatg ttacttgttt 
aaatatatta acgcagtctt gtaggcagct 
gcttggggat gtgcttggag aggcagataa 
ggccggggtg gatccctctt tgtgttgtag 
caagagcctc aacatttcct agagccttat 
gacccaggac attttgatga gatccaaagg 
tcatcataga gaagtaaaca tcacacccaa 
taacctctct gggtgttacc tgctcatttg 



gcaggaagcc ggaagcagcc gcggccccag 60 
cgtggcatta tccttcagtg gggctattgg 120 
agaggattat ggcgtttact ggcccttatt 180 
cccccatttc attgccaaaa gagtcaccta 240 
ggaactggca tatttcttca ctactggaat 3 00 
tcttgctcgt gtggctgtga tcaaatgggg 3 60 
agtcattttc cttacaattc aagggttttt 420 
ctgggagcag tggtagcact ttattctgat 480 
ctatctgtat acatgtgcac atgcggcatt 540 
taataccttt atatatcatg ttcactttaa 600 
attctcagca aatagacctg tcaaatttag 660 
ggctgttcat gtagtcacgg tgctctcaga 720 
gccaccttat gcagtgcatc gaaacctttt 780 
cgctgaagca ggcctctcat gacccaggaa 840 
tccatgctat taaaagtgtg gcccacagac 900 
tagaaatgca gaatctgaag ccccactctg 960 
agttgtatgc acatgaaagt ttgagaagca 1020 
cttccttatc tttccagtgg ctaaaccact 1080 
ttta H14 
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